in 김우재 (2014-)

과학의 죽음 – 논문공장·약탈적학술지·AI 가짜참조가 만들어가는 학문생태계의 붕괴

과학의 죽음

논문공장·약탈적학술지·AI 가짜참조가 만들어가는 학문생태계의 붕괴

김우재

초 록


과학 문헌의 신뢰성은 현대 지식 문명의 토대다. 그러나 2025년 PNAS에 발표된 Richardson 등의 연구와 2026년 Learned Publishing에 게재된 Nicholas 등의 연구는, 이 토대가 조직적·산업적 규모의 부정 행위로 인해 빠르게 침식되고 있다는 냉혹한 증거를 제시한다. 논문공장(paper mill)이 생산하는 가짜 논문은 1.5년마다 두 배씩 증가하는 반면, 전체 합법적 문헌은 두 배 성장에 15년이 걸린다. 철회(retraction) 속도는 가짜 논문 증가 속도의 절반에도 미치지 못한다. 여기에 AI 대형언어모델(LLM)이 생성하는 허구 참조문헌이 PubMed 논문 1만 편당 57개 수준으로 급증하면서, 학문 생태계의 자정 능력은 이미 한계에 도달했다. 현재의 추세가 바뀌지 않는다면, 가짜 논문과 철회 논문의 합이 정상 논문 수를 추월하는 ‘지식 역전(knowledge inversion)’ 현상이 2030년대 전반에 발생할 가능성이 높다. 본 논문은 두 핵심 연구의 데이터를 토대로 붕괴의 메커니즘을 분석하고, 그것이 왜 자기강화적(self-reinforcing) 구조를 갖는지 논증하며, 시스템 전환이 없는 한 학문생태계의 기능적 사망이 피할 수 없는 귀결임을 주장한다.

주요어: 논문공장, 약탈적 학술지, 연구 부정, AI 가짜 참조, 학문생태계 붕괴, 철회, 피어 리뷰 위기


1. 서론: 한 장의 그래프가 말해주는 것

과학은 축적 (蓄積) 위에 서 있다. 한 논문이 다른 논문 위에, 한 세대의 연구자가 이전 세대의 발견 위에 쌓아 올리는 지식의 탑—그것이 과학의 본질이다. 뉴턴이 ‘거인의 어깨 위에 서 있었다’고 말했을 때, 그 ‘거인’은 신뢰할 수 있는 지식의 누적을 의미했다. 그러나 지금 우리가 쌓아 올리고 있는 것의 상당 부분이 허구라면 어떻게 되는가. 거인의 어깨가 아니라 사상누각 위에 올라서고 있다면?

2025년 8월 PNAS에 발표된 Richardson 등의 연구는1 이 불편한 질문에 대한 답을 데이터로 제시한다. 첨부된 Figure A는 그 데이터를 하나의 그래프로 집약한다. 로그 스케일로 그려진 이 그래프에는 네 개의 선이 있다. 맨 위의 검은 선은 전체 과학 논문의 수다. 완만하지만 꾸준한 상승이다. 그 아래, 녹색은 PubPeer 코멘트를 받은 논문, 보라색은 철회된 논문이다. 그리고 2010년대 중반부터 폭발적으로 솟구치는 붉은 선—논문공장 산출물(paper mill products)—이 있다. 이 붉은 선의 기울기는 나머지 모든 선을 압도한다. 2030년에는 이 붉은 선이 합법적 논문의 총량에 근접하거나 교차할 것으로 예측된다. 점선이 그 교차점을 암시한다.


Figure A: 연간 전 세계 과학 활동량. OpenAlex(47)에서 “학술지 논문” 또는 “학술대회 논문”으로 분류된 항목 수(전체 과학 논문), Retraction Watch에 보고된 철회 논문 수, PubPeer에 코멘트가 달린 논문 수, 그리고 논문공장 산출물로 의심되는 논문 수를 각각 나타낸다. 2020–2030년 구간의 외삽에는 로그-선형 도표에서 관찰되는 선형 추세를 활용하였으며, 음영 띠로 95% 신뢰구간을 표시하였다. 논문공장 의심 산출물은 모든 항목 중 가장 빠른 성장률을 보이며, 배증 시간은 1.5년이다.


이 그래프는 단순한 통계가 아니다. 그것은 학문생태계의 구조적 붕괴가 이미 시작되었음을 보여주는 심전도다. 심전도가 평평해지면 심장이 멈춘 것이다. 지금 우리가 보는 것은, 정상 신호보다 잡음이 더 큰 심전도다.

본 논문은 두 개의 핵심 문헌—Richardson 등(2025)¹ 과 Nicholas 등(2026)² —을 중심으로, 이 붕괴의 메커니즘, 규모, 그리고 자기강화적 특성을 분석한다. 그리고 이것이 왜 단순한 ‘학계의 위기’가 아니라 인류 문명의 지식 기반에 대한 실존적 위협인지를 논증한다. 우리는 이미 임계점을 지났거나, 지나고 있는 중일지 모른다.


2. 가짜 과학의 규모: 숫자가 말하는 것

2.1 논문공장의 산출 속도—1.5년마다 두 배

Richardson 등(2025)의 연구는 논문공장이 생산한 의심 논문(suspected paper mill products) 32,786편을 포함하는 데이터셋을 구축하고, 이를 전체 과학 문헌의 성장, 철회 속도, PubPeer 코멘트 속도와 비교했다. 결과는 충격적이다.

논문공장 산출물은 1.5년마다 두 배씩 증가한다. 반면 전체 과학 논문은 두 배가 되는 데 15년이 걸린다. 철회 논문은 3.3년마다, PubPeer 코멘트 논문은 3.6년마다 두 배가 된다. 즉, 가짜 과학은 자정 메커니즘보다 10배 빠르게 성장하고 있다.

이 수치가 의미하는 바를 구체적으로 계산해보자. 논문공장 산출물의 성장률을 연간 약 60%(1.5년 두 배)로 가정하고, 철회의 성장률을 연간 약 23%(3.3년 두 배)로 가정하면, 두 추세선 간의 격차는 매년 37%p씩 벌어진다. 2025년 현재 논문공장 산출물의 절반도 철회되지 않는다는 사실—연구팀은 현재 추세로는 가짜 논문의 약 25%만이 결국 철회될 것이며 약 10%만이 색인 취소 저널에 게재될 것으로 추정한다—을 고려하면, 학문 문헌에 누적되는 가짜 논문의 총량은 가속적으로 증가하고 있다.

Richardson 등은 또한 미래 전망을 log-linear 외삽된 점선으로 제시한다. Figure A가 그것이다. 2030년경, 논문공장 산출물의 연간 생산량은 PubPeer 코멘트 논문 수를 초과하고, 철회 논문 수는 훨씬 앞지른다. 전체 합법적 논문과의 교차점은 예측 구간 안에 들어온다. 이것이 앞서 말한 ‘지식 역전(knowledge inversion)’의 수학적 표현이다.

2.2 탐지 체계의 무력화—숟가락으로 욕조 물 빼기

그렇다면 탐지 체계는 작동하고 있는가. 학문 문헌의 경찰관 역할을 하는 기제는 크게 세 가지다: 철회(retraction), 색인 취소(deindexing), 그리고 동료 사후 검토(post-publication peer review, 주로 PubPeer). Richardson 등의 데이터는 이 세 기제 모두가 규모의 측면에서 이미 압도당하고 있음을 보여준다.

저널 색인 취소를 보자. WoS와 Scopus는 매년 수백 개 저널을 색인에서 제외한다. 그러나 Richardson 등의 분석에 따르면, 논문공장 산출물을 게재하는 저널의 수는 색인 취소 저널의 수보다 10배 이상 많다.⁴ 가짜 논문이 유통되는 채널이 막히는 속도보다 새로운 채널이 생기는 속도가 훨씬 빠른 것이다.

더욱 심각한 것은 ARDA(Academic Research and Development Association)의 사례에서 드러나는 ‘저널 홉핑(journal hopping)’이다. ARDA는 웹사이트에서 대놓고 논문 게재를 보장하는 저널 목록을 공시하는 서비스다. Richardson 등은 웨이백 머신을 이용해 2018년부터 2024년까지 ARDA의 저널 포트폴리오 변화를 추적했다. 2018년 1월 14개였던 저널 목록은 2024년 3월 86개로 늘었다. 핵심적 발견은 이것이다: ARDA의 저널 목록은 Scopus나 WoS가 특정 저널을 색인 취소할 때마다 그에 직접 반응해 업데이트된다. 즉, 이들은 탐지 및 제재 시스템을 실시간으로 모니터링하며 그것을 회피하는 전략을 능동적으로 구사한다.⁵

이 연구에서 가장 불편한 사실 중 하나는 ARDA가 게재를 보장한 저널 중 Scopus 인덱스 저널이 33%나 이후 색인 취소된 반면, 전체 Scopus 저널의 색인 취소율은 0.5%에 불과하다는 점이다. 이것은 ARDA가 표적으로 삼는 저널의 선정이 얼마나 정교한지를 보여준다. 그들은 아직 색인 취소되지 않은, 그러나 취약한 저널들을 정확히 겨냥한다.

2.3 편집 카르텔—0.25%의 편집자가 30%의 철회를 책임진다

Richardson 등의 또 다른 핵심 발견은 편집자 네트워크의 공모 구조다. 연구팀은 PLOS ONE(2006년 이후 276,956편 게재)과 Hindawi 저널들을 분석했다. PLOS ONE에서 18,329명의 편집자 중 단 0.25%에 해당하는 45명이 전체 철회 논문의 30.2%를 담당했다. 이 45명은 서로 긴밀히 연결된 네트워크를 형성하고 있었으며, 4개국의 기관에 소속된 이 편집자 집단은 상호 제출 논문을 서로 우선 처리하는 관행을 보였다.⁶

더 나아가 특정 저자들이 이 ‘문제 편집자’들에게 불균형적으로 높은 비율로 논문을 배정받은 패턴도 확인됐다. 이것은 우연이 아니다. Joelving(2024)의 Science 탐사 보도⁷ 는 논문공장들이 저널 편집자에게 뇌물을 제공하고 편집위원회에 자체 요원을 심어두는 방식을 구체적으로 폭로했다. Richardson 등의 통계적 분석은 이 보도의 규모를 정량적으로 확인한 것이다.

Hindawi 저널 분석에서는 그 수치가 더 크게 나온다. 10개 Hindawi 저널에서 철회·PubPeer 코멘트 논문을 비정상적으로 많이 처리한 편집자가 각각 53명과 52명으로 확인됐다. 더욱이 이 중 일부는 복수 저널에서 동시에 플래그 처리됐다. 이것은 논문공장과 편집 카르텔이 단일 저널을 넘어 출판사 간 네트워크로 작동함을 의미한다.

2.4 분야별 불균등 침투—RNA 생물학이 이미 오염됐다

Richardson 등은 RNA 생물학의 6개 하위 분야(CRISPR-Cas9, tRNA·발생, tRNA·암, 원형 RNA, miRNA·발생, miRNA·암, lncRNA)를 비교 분석했다. 정상적인 오류 수준의 지표인 정오표(errata) 발표율은 모든 분야에서 1.5-2.5%로 균일했다. 그러나 철회율은 극적인 차이를 보였다.

CRISPR-Cas9의 철회율은 0.1%다. 이것이 정상적인 수준이다. 그러나 lncRNA와 miRNA-암 연구의 철회율은 피크 기준 약 4%로, 정오표 발표율보다 높다. 정오표 발표율보다 높은 철회율은 선의의 실수가 아닌 조직적 사기를 의미한다. 이미 이 분야들의 문헌은 심각하게 오염되어 있고, ‘회복 불가능한 손상’을 입었을 가능성이 있다.⁸

이것이 초파리 유전학자인 내가 특히 두려워하는 지점이다. miRNA와 lncRNA는 나의 연구 분야와 인접해 있다. 기초 생물학의 핵심 분야들이 논문공장에 의해 체계적으로 표적화되고 있다는 사실은, 이 오염이 의학이나 임상 연구를 넘어 순수 기초과학의 토대로까지 침투하고 있음을 의미한다. 오늘 내가 인용하는 논문이, 어제 브로커가 조립한 가짜일 수 있다.


3. 연구자들은 알고 있었다: Nicholas 등(2026)의 증언

3.1 ‘부서지고 있는 중’: 62명 연구자의 현장 증언

Richardson 등의 연구가 거시적 데이터로 붕괴를 보여준다면, Nicholas 등(2026)²의 연구는 그 붕괴를 직접 목격하는 사람들의 목소리를 담는다. 이 연구는 말레이시아, 폴란드, 포르투갈, 러시아, 스페인, 영국/국제 그룹의 초기경력연구자(ECR) 62명을 대상으로 심층 인터뷰를 진행하고, 광범위한 문헌 검토를 병행했다.

핵심 질문은 간단했다: ‘당신의 분야에서 나쁜 과학과 의문스러운 연구 관행을 알고 있는가? 그런 관행의 결과가 출판되는 것을 본 적이 있는가?’ 응답자의 79%가 ‘그렇다’고 답했다. 단 13%만이 ‘아니다’라고 했다.⁹

이 수치 자체도 충격적이지만, 연구자들이 들려준 현장의 목소리는 더욱 생생하다. 한 재료과학자는 이렇게 말했다. ‘그냥 어느 정도는 흔한 일인 것 같다(I almost feel like it’s partially common).’ 말레이시아의 한 의학 연구자는 AI가 생성한 논문이 심각한 부작용을 ‘편리하게’ 누락했다는 이유로 철회된 사례를 언급했다. 폴란드의 한 환경과학자는 논문공장이 생산한 저품질 오픈액세스 논문들이 LLM 훈련 데이터셋에 포함될 경우 ‘지식 베이스를 오염시킨다’고 경고했다.

‘가짜 논문들은 학계의 신뢰성을 훼손하는 불량 과학과 의문스러운 관행의 사례다. 나는 비윤리적인 관행의 결과물이 출판되는 것을 목격했다. 이런 관행에는 데이터 조작, 약탈적 저널에의 게재, 방법론의 불투명성 등이 포함된다. 과학 공동체가 이런 관행을 식별하고 대처하는 엄격한 조치를 취하는 것이 필수적이다.’ — 포르투갈, 수학과학자

3.2 국가별 차등 위기—그러나 아무도 안전하지 않다

Nicholas 등은 각국 면접자에게 ‘학문 시스템이 어느 정도나 붕괴되고 있는가’를 1(전혀 아님)에서 5(완전 붕괴)까지 평가하게 했다. 영국(국제그룹)과 말레이시아는 2점, 폴란드는 2-3점, 스페인·러시아·포르투갈은 3점을 받았다. 문헌 검토 결과는 4점이었다.1

여기서 중요한 것은 점수 자체보다 그 차이의 이유다. 문헌이 4점(광범위하고 시스템적인 사기의 명확한 증거, 범죄 수준)을 받은 반면 ECR 인터뷰가 2-3점을 받은 것은, 현장 연구자들이 보는 것과 집계된 데이터가 보여주는 것 사이에 심각한 인식 격차가 있음을 의미한다. 연구자들은 자신이 직접 경험하는 범위 내에서만 문제를 인식한다. 그러나 시스템 수준에서는 훨씬 더 큰 빙산이 잠겨 있다.

러시아의 사례는 특히 시사적이다. 2012년 대통령령으로 WoS 게재 논문 비율을 2.44%까지 끌어올리라는 목표가 설정되자, 논문 수는 폭발적으로 늘었지만 질적 향상은 없었다. ‘출판 아니면 소멸(publish or perish)’이 시스템에 깊이 내재화됐다.1 이것은 한국의 학술용병 논란과 정확히 같은 구조다. 숫자 목표가 조작 인센티브를 만들고, 조작 인센티브가 시스템을 오염시킨다.

3.3 AI의 등장과 ECR의 공포

Nicholas 등의 연구에서 반복적으로 등장하는 테마는 AI에 대한 양가적 공포다. 거의 모든 국가의 ECR들이 AI가 연구에 유용하면서도 위험하다는 인식을 공유했다. 그 위험의 핵심은 두 가지다. 첫째, AI가 가짜 인용을 생성하는 ‘환각(hallucination)’ 문제. 한 말레이시아의 의학 연구자는 학생이 AI가 생성한 가짜 참조를 거의 공동 논문에 포함시킬 뻔한 사례를 언급했다. 둘째, LLM이 저품질·약탈적 출판물로 훈련될 경우의 오염 피드백 루프.1, 2

이 두 번째 위험은 특히 치명적이다. 논문공장이 가짜 논문을 생산 → 그 논문들이 오픈액세스로 공개 → LLM이 그것을 훈련 데이터로 흡수 → LLM이 편향된 정보를 생성 → 연구자들이 LLM에 의존하여 논문 작성 → 더 많은 가짜 논문 생산. 이것은 가짜 지식의 자기복제 루프다. 일단 이 루프가 충분한 규모에 도달하면, 어떤 외부적 개입 없이도 스스로 유지·확장된다.


4. 붕괴의 메커니즘: 왜 자기강화적인가

4.1 공유지의 비극으로서의 학문 시스템

Richardson 등은 과학 시스템을 공공재 게임(public goods game)의 프레임으로 분석한다. 과학자, 대학, 저널, 정부, 기업이 서로에게 의존하는 협력 시스템이지만, 각 참여자는 무임승차(defection)의 유혹에 노출된다. 과거에는 이런 이탈이 드물었다. 그러나 인터넷과 오픈액세스 출판이 가짜 과학의 생산·유통 비용을 극적으로 낮추면서, 이탈의 합리적 유인이 급격히 커졌다.¹³

특히 평가 지표(h-index, 저널 임팩트팩터, 대학 순위)가 학자와 기관의 성과를 측정하는 도구가 되자, 그 지표를 ‘게임’하는 것이 합리적 선택이 됐다. 논문을 구매하고, 인용을 거래하고, 편집자를 매수하는 것이—비윤리적이지만—비용 대비 효율적인 전략이 된 것이다. Richardson 등의 분석에 따르면 중국 남서부 의학 레지던트의 46.7%가 논문 구매·판매 또는 대리 작성에 관여한 적이 있다고 자기보고했다.¹⁴ 이것은 더 이상 소수 일탈자의 행동이 아니다. 새로운 표준(new norm)이 되고 있다.

4.2 탐지 메커니즘의 구조적 한계

현재의 탐지·제재 시스템이 왜 작동하지 않는가. Richardson 등은 세 가지 구조적 이유를 제시한다.

첫째, 이해충돌(conflict of interest)의 문제다. 저널 편집자는 논문공장으로부터 신속 게재의 대가로 돈을 받는다. 연구기관은 자체 과학자의 비위를 조사할 때 이해충돌이 발생한다. 둘째, 규모의 문제다. 탐지는 소수의 자원봉사 ‘무결성 탐정’들에게 의존하고 있는데, 이들은 법적 위협에 노출되거나 ‘자경주의자’로 비난받는다. 이런 고립된 개인들에게 시스템 수준의 문제 해결을 맡기는 것은 근본적으로 무리다. 셋째, 속도의 문제다. 철회는 시간과 관료주의적 절차를 필요로 하는 반면, 논문공장은 AI의 도움으로 수일 내에 가짜 논문을 생산한다.¹⁵

Nicholas 등의 연구에서 한 폴란드 소셜 사이언티스트가 이 상황을 날카롭게 묘사했다. LLM이 주류적 관점을 재생산하며 연구 결과를 조작할 수 있다고 경고하면서, ‘우리는 그것이 사실인지 아닌지 잡으려 하는 리뷰어들의 경찰이 될 것’이라고 했다. 그것이 현재 우리가 가고 있는 방향이다. 모든 연구자가 논문 경찰이 되어야 하는 세계.

4.3 AI 가짜 참조의 오염 피드백 루프

Topaz 등(2026)이 Lancet에 발표한 서한1, 6 은 또 다른 오염 채널을 수치화한다. PubMed 논문 10,000편당 포함된 가짜 참조문헌은 2023년 4개에서 2026년 1월 57개로 불과 3년 만에 12배 이상 증가했다. 연구팀은 250만 건의 참조를 직접 검증해 4,406개의 완전 허구 참조를 확인했다. 이 폭발적 증가는 2024년 중반 AI 작문 도구의 대중화와 정확히 일치한다.

가짜 참조는 단순한 실수가 아니다. 그것은 지식의 연쇄 오염이다. A 논문의 가짜 참조가 B 논문에 재인용되고, B가 C에 인용되면, 없던 지식이 있는 것처럼 학문 생태계에 자리를 잡는다. 이 오염이 LLM 훈련 데이터로 들어가면, LLM은 그 허구를 ‘사실’로 학습하고 더 많은 가짜 참조를 생성하는 데 사용한다. 이것이 앞서 언급한 자기복제 루프의 메커니즘이다.

한편, 네덜란드의 한 저널에서 실제로 발생한 사례가 이 위험을 생생하게 보여준다. 750단어짜리 짧은 서한에서 15개 참조 중 10개가 검색 불가능한 논문이었고, 그 중 하나는 해당 저널 자체에 게재된 가상의 논문이었다. AI가 자신이 투고된 바로 그 저널의 없는 논문을 참조로 지어낸 것이다. 논문은 철회됐지만, 비슷한 사례들은 학계 곳곳에 잠복해 있다.¹⁷

4.4 세 가지 부정의 시너지

논문공장 논문, 약탈적 저널, AI 가짜 참조는 서로 독립적인 문제가 아니다. 이 세 요소는 시너지를 발휘하며 오염을 가속화한다.

첫째 시너지: 논문공장은 AI를 이용해 논문을 대량 생산한다. AI는 참조를 환각으로 채워 그럴듯하게 만든다. 가짜 참조가 많은 논문은 진짜 참조를 가진 논문처럼 보인다. 동료심사는 개별 참조를 검증하지 않는다. 논문은 통과된다.

둘째 시너지: 약탈적 저널은 APC(논문처리비용)를 받고 거의 아무 논문이나 출판한다. 논문공장은 APC를 지불할 고객을 모집한다. ‘출판 아니면 소멸’ 압박을 받는 연구자들은 고객이 된다. 약탈적 저널은 WoS나 Scopus에 색인되어 있는 동안 실적으로 인정된다.

셋째 시너지: 오픈액세스 정책은 지식의 민주화를 위한 것이었다. 그러나 동시에 저품질 논문들을 무제한으로 공개하게 함으로써, LLM의 훈련 데이터로 대량 유입되는 경로를 열었다. AI는 좋은 논문과 나쁜 논문을 구별하지 못한다. 오염된 LLM은 오염된 논문을 더 많이 생산하는 데 기여한다.

Nicholas 등의 연구는 이 시너지를 인식하는 연구자들이 늘고 있음을 보여준다. 그러나 인식이 곧 해결책은 아니다. 그들은 ‘세계가 어떻게 돌아가는지 알지만, 내가 직접 참여하지는 않는다’는 개인적 회피 전략을 택한다. 그러나 시스템 수준의 오염은 개인의 청렴함으로 막을 수 없다.


5. 한국 학술용병 논란: 붕괴의 국내 버전

2026년 봄 연세대와 고려대를 중심으로 불거진 ‘학술용병’ 논란은 이 글로벌 붕괴 메커니즘의 한국판이다. 강의실에 나타난 적 없는 외국인 교수들이 대학 소속을 표기해 수백 편의 논문을 발표하고, 그 논문들이 QS·THE 순위 상승에 활용됐다. 고려대는 180여 명의 고인용 외국 연구자를 영입해 THE 순위를 200위권 밖에서 156위로 끌어올렸다.¹⁸

이것은 Richardson 등이 분석한 ‘지표 게임’의 한국적 형태다. 시스템이 측정하는 지표를 조작하는 것이 합리적 전략이 된 환경에서, 대학들은 합법적 경로를 통해 순위 게임을 했다. 학술용병은 논문공장의 고급 버전이다. 논문공장이 가짜 데이터로 논문을 만든다면, 학술용병은 진짜 데이터로 진짜 논문을 쓰지만 그것을 실제로 해당 대학과 아무 관계 없는 방식으로 대학 실적에 귀속시킨다.

더욱 우려스러운 것은 학술용병이 쏟아내는 논문들 중 일부가 AI 생성 가짜 참조를 포함할 가능성이다. 6년간 496편을 발표한 연구자의 논문을 대학이 한 편씩 검토했을 리 없다. 숫자만 올라가면 됐으니. 이것이 논문공장, 학술용병, AI 가짜 참조가 하나의 생태계 안에서 어떻게 연결되는지를 보여주는 한국적 사례다.


6. 이대로 가면 학문 생태계는 기능적으로 사망한다

6.1 임계점과 비가역성

Richardson 등은 신중한 과학자답게 ‘현재 추세가 계속된다면’이라는 조건을 붙인다. Nicholas 등은 ‘아직 완전히 부서지지는 않았지만, 부서지고 있다(not totally broken, but breaking)’는 표현을 쓴다. 그러나 이 조심스러운 언어 뒤에 숨은 데이터를 직시하면, 조건적 전망은 사실상 무조건적 경고에 가깝다.

왜냐하면 이 시스템은 자기강화적(self-reinforcing) 구조를 갖기 때문이다. 무임승차자(defector)의 수가 증가하면 협력의 기대 이익이 감소한다. 협력의 기대 이익이 감소하면 더 많은 사람들이 무임승차를 선택한다. 이 동학은 공공재 게임 연구에서 잘 알려진 ‘협력 붕괴 임계점(tipping point)’ 현상이다.¹⁹ Richardson 등이 인용한 데이터에 따르면, 중국 의학 레지던트의 46.7%가 이미 이탈 행동을 했다. 이것은 이미 임계점에 매우 가깝거나 임계점을 넘어선 수준일 수 있다.

비가역성도 중요하다. lncRNA와 miRNA 분야의 문헌이 이미 ‘회복 불가능하게 손상됐을 가능성이 있다’는 Richardson 등의 진단은 단순한 경고가 아니다. 한번 오염된 문헌 기반은 복구하기 매우 어렵다. 현재 전체 의심 논문공장 산출물의 28.7%만이 철회됐고, 연구팀의 추정으로는 결국 25%만이 철회될 것이다. 나머지 75%는 영구히 문헌에 남는다.

6.2 지식 역전의 수학

앞서 소개한 Figure B의 추세를 수치로 환산해보자. 논문공장 산출물의 연간 성장률이 60%이고 전체 합법적 논문의 성장률이 약 5%라면, 현재 논문공장 산출물이 전체 문헌의 약 0.5%를 차지한다고 가정할 경우:

• 5년 후(2030년경): 논문공장 산출물이 연간 가짜 논문 수에서 연간 PubPeer 코멘트 수를 초과

• 8년 후(2033년경): 논문공장 산출물의 연간 산출이 연간 철회 수의 100배 초과

• 10-15년 후: 논문공장 산출물의 누적 합이 정상 논문 누적 합을 추월하는 ‘지식 역전’ 시나리오

물론 이것은 추세의 선형 연장이다. 현실에서는 어느 시점에 자체적 한계(예: 저널 수의 포화, 대규모 탐지 시스템 도입)에 의해 성장이 둔화할 수 있다. 그러나 Richardson 등의 분석은 현재까지 어떤 개입도 가짜 과학의 성장을 유의미하게 둔화시키지 못했음을 보여준다. ARDA와 같은 조직은 오히려 개입에 적응(adaptation)하며 더 정교해졌다.

6.3 신뢰의 비가역적 침식

수치적 붕괴보다 더 위험한 것은 신뢰의 붕괴다. 과학은 궁극적으로 신뢰 체계다. 연구자가 다른 연구자의 데이터를 신뢰하고, 독자가 논문을 신뢰하고, 정책 입안자가 과학적 합의를 신뢰할 때 과학은 작동한다. 그러나 가짜 과학의 규모가 임계치를 넘으면, 신뢰 자체가 불가능해진다.

이미 그 조짐이 보인다. Nicholas 등의 연구에서 여러 ECR들은 이제 ‘저명한 저널에도 의심스러운 논문이 게재된다’는 인식을 공유했다. 한 재료과학자는 스팸 빈도로 저널의 신뢰성을 판단한다고 했다. 이것은 무엇을 의미하는가. 정상적인 학술 커뮤니케이션 채널이 신뢰받지 못하는 상황을 의미한다. 과학자들이 서로를 의심하고, 논문 하나하나를 의심하는 세계에서 협력적 지식 축적은 불가능하다.

Jo Nova가 Richardson 등의 연구를 소개하며 말했듯, ‘과학이 논문을 몇 편 발표했느냐의 문제가 되고, 수십억 달러가 ‘신성한 전문가들’에게 의존하게 되자, 그것은 이미 빈 껍데기가 됐다.’⁴ 거기에 더해 수십억 달러가 논문공장에 흘러가고, AI가 가짜 지식을 생성하면 ‘빈 껍데기’를 넘어 ‘독이 든 껍데기’가 된다.


7. 무엇이 필요한가: 시스템 전환의 조건

7.1 현재의 처방이 왜 불충분한가

기존 대응책들은 왜 효과가 없는가. Richardson 등은 명확하게 진단한다. 저널 색인 취소는 논문공장이 이미 회피하고 있다. 철회는 너무 느리고, 범위가 너무 좁다. 동료 심사 강화는 심사자 부족 문제로 이미 한계에 직면했다. AI 기반 탐지 도구는 개발 중이지만, 논문공장도 동일한 AI를 더 빠르게 활용한다. Nicholas 등의 연구에서 확인됐듯, 국가별 화이트리스트, 약탈적 저널 목록, 부처 지침 등의 조치는 모두 ‘느리게 오는 반면 위조자들은 매우 빠르게 작동할 수 있다(slow to come about while the fakers can work very quickly)’는 구조적 비대칭을 극복하지 못한다.²⁰

7.2 시스템 전환의 세 축

Richardson 등은 근본적 변화를 위해 탐지, 조사, 제재의 세 가지 과제를 서로 다른 주체에게 분리해야 한다고 주장한다. 이해충돌이 있는 주체는 조사자가 될 수 없다. 저널은 자신이 게재한 논문의 부정 여부를 조사할 수 없다. 대학은 자기 교수의 비위를 독립적으로 조사할 수 없다. 독립적이고 충분한 자원을 가진 제3의 기관이 필요하다.

평가 시스템의 근본적 재설계도 필수다. 논문 수와 피인용 수로 연구자를 평가하는 한, 그것을 조작하는 합리적 유인은 사라지지 않는다. 러시아는 아이러니하게도 2022년 이후 Scopus/WoS 게재를 필수 평가 기준에서 제외하는 방향으로 정책을 전환했다.1 그것이 옳은 방향인지는 별개로, 지표가 지표 이상이 돼서는 안 된다는 교훈은 보편적이다.

마지막으로, 참조 검증 인프라의 의무화가 필요하다. Topaz 등이 제안했듯, 논문 제출 시 CrossRef나 PubMed API로 모든 참조의 존재를 자동 검증하는 시스템을 의무화해야 한다. AI가 가짜 참조를 생성하는 속도로 AI가 가짜 참조를 탐지하도록 해야 한다.

7.3 우리에게 남은 시간

Richardson 등은 논문을 이렇게 맺는다. ‘문화와 인센티브를 바꾸는 것은 느린 과정이다. 현상 유지로 이익을 보는 많은 이해관계자들의 참여 없이는 변화가 어렵다. 그러나 상황의 심각성은 긴급한 행동을 요구한다.’ Nicholas 등은 ‘해결책은 빨리 올수록 좋다’고 했다.²¹

그렇다면 우리에게 남은 시간은 얼마인가. Figure A가 말해주듯, 논문공장 산출물이 정상 논문의 연간 생산량에 근접하는 시점이 2030년경으로 예측된다. 5년이 채 안 남았다. 그것이 ‘지식 역전’의 수학적 임계점은 아닐 수 있다. 그러나 그 수준이 되면, 논문 하나를 볼 때마다 그것이 가짜일 가능성을 50% 이상으로 고려해야 하는 세계가 온다. 그런 세계에서 과학은 기능한다고 말할 수 있는가.


8. 결론: 빈 껍데기를 넘어 독이 든 껍데기로

나는 초파리를 연구한다. 한 마리의 초파리를 가지고 유전자 한 개의 기능을 밝히는 데 수년이 걸린다. 그 수년의 실험 위에 내 논문이 있고, 내 논문은 다른 연구자의 실험의 기초가 된다. 나는 내가 인용하는 논문들이 누군가의 진짜 실험과 진짜 관찰의 기록이라고 신뢰하기 때문에 그것을 인용한다. 그 신뢰가 없으면, 나의 연구도 없다.

그 신뢰가 지금 무너지고 있다. Richardson 등이 분석한 데이터는 이미 RNA 생물학의 일부 분야가 ‘회복 불가능하게 오염됐을 가능성’이 있다고 경고한다. Nicholas 등이 인터뷰한 연구자들은 이미 자신의 분야에서 의문스러운 논문들이 게재되는 것을 일상으로 목격하고 있다. 그리고 그래프의 붉은 선은 계속 솟구치고 있다.

‘시스템은 완전히 부서지지 않았지만, 부서지고 있는 중이다.’ 이것이 Nicholas 등의 결론이다. 그러나 나는 더 나아가야 한다고 생각한다. 과학은 이미 빈 껍데기가 되어가고 있고, AI와 논문공장의 시너지가 계속된다면 독이 든 껍데기가 될 것이다. 우리가 인용하는 논문, 우리가 의존하는 연구, 우리가 신뢰하는 지식—그 모든 것이 오염의 잠재적 매개체가 되는 세계.

그것은 단순히 학계의 위기가 아니다. 의학적 결정, 환경 정책, 기술 개발이 모두 과학적 지식에 기반한다. 가짜 지식이 실제 의사결정을 오도하는 순간, 피해는 실제 세계로 나온다. 잘못된 임상 연구를 기반으로 처방된 약, 오염된 데이터를 학습한 AI 진단 시스템, 가짜 환경 연구에 기반한 정책. 이것이 학문생태계의 붕괴가 만드는 실제 세계의 재앙이다.

우리는 지금 선택의 기로에 서 있다. 시스템을 근본적으로 바꾸거나, 아니면 인류의 지식 인프라가 기능적으로 사망하는 것을 지켜보거나. 그 선택에 남은 시간은 길지 않다.

(김우재, 2026년 5월 16일)


주석

1 Richardson RA, Hong SS, Byrne JA, Stoeger T, Amaral LAN. The entities enabling scientific fraud at scale are large, resilient, and growing rapidly. Proc Natl Acad Sci USA. 2025;122(32):e2420092122. doi:10.1073/pnas.2420092122

2 Nicholas D, Herman E, Akeroyd J, et al. Is the Scholarly System Breaking Down? Learned Publishing. 2026;39:e2060. doi:10.1002/leap.2060

3 Richardson 등(2025), Fig. 5B: 의심 논문공장 산출물의 배증 시간 1.5년 대 전체 문헌 배증 시간 15년.

4 Richardson 등(2025), Fig. 5C 및 본문: ‘색인 취소는 현재 논문공장 산출물을 게재하는 저널의 수보다 10배 적은 수준에서 이루어지고 있다.’

5 Richardson 등(2025), Fig. 3: ARDA의 저널 포트폴리오 변화 분석. 2018년 1월 14개에서 2024년 3월 86개 저널로 확장. 색인 취소에 직접 반응하는 포트폴리오 업데이트 패턴 최초 보고.

6 Richardson 등(2025), Fig. 1: PLOS ONE에서 0.25%의 편집자(45명)가 전체 철회 논문의 30.2%를 처리. 이 45명 중 25명이 PLOS ONE에서 직접 철회된 논문의 저자이기도 함.

7 Joelving F. Paper Trail. Science. 2024;383(6680):252–255. doi:10.1126/science.zrjehzt

8 Richardson 등(2025), Fig. 4: lncRNA 및 miRNA-암 분야에서 피크 철회율이 약 4%로 정오표 발표율(1.5-2.5%)을 초과. ‘이 비율들은 선의의 실수와 양립하지 않으며 조직적 사기 시도를 가리킨다.’

9 Nicholas 등(2026), Table 2: ECR 62명 중 49명(79%)이 자신의 분야에서 나쁜 과학과 의문스러운 관행을 알고 있으며 그 결과가 출판되는 것을 보았다고 응답.

10 Nicholas 등(2026), 7. Discussion and Conclusions: 국가별 점수—영국 2, 말레이시아 2, 폴란드 2-3, 스페인 3, 러시아 3, 포르투갈 3, 문헌 검토 4.

11 Nicholas 등(2026), 6.3.5 Russia: 2012-2020년 대통령령에 따른 WoS 게재 비율 목표 설정과 그 결과로서의 publish-or-perish 내재화. 2022년 이후 전문가 평가 중심 시스템으로 전환.

12 Nicholas 등(2026), 6.3.2 Malaysia: ‘오픈액세스를 통해 공개된 약탈적 저널의 저품질 자료들이 LLM 훈련에 활용될 경우, 오류 정보를 담은 LLM 출력물로 이어질 수 있다.’ — 환경과학자 인용.

13 Richardson 등(2025): 공공재 게임 프레임 적용. ‘가짜 논문 구매와 같은 이탈 행동이 많은 후발 의사 및 신진 과학자들에게 새로운 표준이 되고 있을 수 있다.’

14 Chen 등(2024): 중국 남서부 3차 병원 의학 레지던트 조사에서 46.7%가 논문 구매·판매, 대리 작성 관여를 자기보고. Richardson 등(2025)에서 재인용.

15 Richardson 등(2025), Discussion: ‘탐지는 소수의 고립된 자원봉사자들에게 의존하며, 이들은 법적 위협이나 자경주의자 비난에 노출됐다.’ 이해충돌 없는 독립 조직의 필요성 강조.

16 Topaz M, Roguin N, Gupta P et al. Fabricated citations: an audit across 2·5 million biomedical papers. The Lancet. 2026;407:1779–1781. PubMed 논문 10,000편당 가짜 참조 57개(2026년 1월), 2023년 4개 대비 12배 이상 급증.

17 Retraction Watch (2026.01.28): Medical journal publishes a letter on AI with a fake reference to itself. https://retractionwatch.com/2026/01/28/medical-journal-publishes-a-paper-on-ai-with-a-fake-reference-to-itself/

18 연합뉴스 (2026.03.29): 강의실엔 없는 외국인 석학…연고대 ‘학술 용병’ 논란. AKR20260329044200004. / 이덕환 (2026.05.06): 학술용병 논란, 낯뜨거운 대학의 도덕적 해이. Daum 뉴스.

19 Fehr E, Gächter S (2000): Cooperation and punishment in public goods experiments. Am Econ Rev 90:980–994. / Tyler TR, Blader SL (2003): The group engagement model. Pers Soc Psychol Rev 7:349–361. Richardson 등(2025)에서 재인용.

20 Nicholas 등(2026), Abstract: ‘화이트리스트, 지역 저널, 국가 정책 같은 변화들은 모두 느리게 도래하는 반면 위조자들은 매우 빠르게 작동할 수 있다.’

21 Richardson 등(2025), Discussion: ‘상황의 심각성은 긴급한 행동을 요구한다. 가능한 한 빨리.’ / Nicholas 등(2026), Conclusions: ‘전 지구적·국가 특정 수준의 해결책이 긴급히 요구되며, 빠를수록 좋다.’

─────────────────────────────────────────────────────────────

참고문헌

Richardson RAK, Hong SS, Byrne JA, Stoeger T, Amaral LAN. The entities enabling scientific fraud at scale are large, resilient, and growing rapidly. Proceedings of the National Academy of Sciences of the United States of America. 2025;122(32):e2420092122. https://doi.org/10.1073/pnas.2420092122

Nicholas D, Herman E, Akeroyd J, Abrizah A, Swigon M, Revez J, Rodríguez-Bravo B, Polezhaeva T. Is the Scholarly System Breaking Down? Learned Publishing. 2026;39:e2060. https://doi.org/10.1002/leap.2060

Topaz M, Roguin N, Gupta P et al. Fabricated citations: an audit across 2·5 million biomedical papers. The Lancet. 2026;407:1779–1781.

Joelving F, Labbé C, Cabanac G. Fake Papers Are Contaminating the World’s Scientific Literature, Fueling a Corrupt Industry and Slowing Legitimate Lifesaving Medical Research. The Conversation. 2025, January 29.

Joelving F. Paper Trail. Science. 2024;383(6680):252–255. https://doi.org/10.1126/science.zrjehzt

Else H, Van Noorden R. The Fight Against Fake-Paper Factories That Churn Out Sham Science. Nature. 2021;591(7851):516–520. https://doi.org/10.1038/d41586-021-00733-5

Van Noorden R. More Than 10,000 Research Papers Were Retracted in 2023—A New Record. Nature. 2023;624(7992):479–481. https://doi.org/10.1038/d41586-023-03974-8

Oransky I. Up to one in seven submissions to hundreds of Wiley journals flagged by new paper mill tool. Retraction Watch. 2024. https://retractionwatch.com/2024/03/14/up-to-one-in-seven-of-submissions-to-hundreds-of-wiley-journals-show-signs-of-paper-mill-activity/

Wittau J, Seifert R. How to Fight Fake Papers: A Review on Important Information Sources and Steps Towards Solution of the Problem. Naunyn-Schmiedeberg’s Archives of Pharmacology. 2024;397(12):9281–9294. https://doi.org/10.1007/s00210-024-03272-8

Nova J. Fake Science Growing Faster Than Real Science: Dodgy Papers Doubling Every 18 Months. JoNova Blog. 2025. https://joannenova.com.au/2025/09/fake-science-growing-faster-than-real-science-dodgy-papers-doubling-every-18-months/

Xie Y, Wang K, Kong Y. Prevalence of Research Misconduct and Questionable Research Practices: A Systematic Review and Meta-Analysis. Science and Engineering Ethics. 2021;27(4):41. https://doi.org/10.1007/s11948-021-00314-9

Gopalakrishna G, Ter Riet G, Vink G, et al. Prevalence of Questionable Research Practices, Research Misconduct and Their Potential Explanatory Factors: A Survey Among Academic Researchers in The Netherlands. PLoS One. 2022;17(2):e0263023.

Chen L et al. Knowledge, attitudes and practices about research misconduct among medical residents in southwest china: A cross-sectional study. BMC Med Educ. 2024;24:284.

COPE and STM. Paper mills – research report from COPE and STM. Committee on Publication Ethics. 2022.

Abalkina A. Publication and collaboration anomalies in academic papers originating from a paper mill: Evidence from a Russia-based paper mill. Learn Publ. 2023;36:689–702.

연합뉴스. 강의실엔 없는 외국인 석학…연고대 ‘학술 용병’ 논란. 2026.03.29. AKR20260329044200004.

연합뉴스. 학술용병 의혹에 칼 빼든 교육부, QS 상위권大 타깃 조사 착수. 2026.04.11. AKR20260411053400004.

이덕환. 학술용병 논란, 낯뜨거운 대학의 도덕적 해이. 다음뉴스. 2026.05.06.


“본 저작물은 AI 기술을 활용하여 초안을 구성하였고, 발행인(김우재)의 최종 검수 및 보완을 거쳐 완성되었습니다.”

“Credit: Written by Woo Jae Kim (with AI assistance), Reviewed by Woo Jae Kim”