세계 대학 순위 경쟁과 연구윤리의 위기

학술용병·논문공장·가짜 참조의 실상

요약

국내외 학계에서 가짜 참조문헌과 학술용병 논란이 동시에 부상하며 연구윤리에 경종을 울리고 있다. 최근 톱학술지 Lancet 서한에 따르면, 2026년 현재 PubMed 논문 10,000편당 57개 이상의 가짜 참조가 포함된 것으로 나타나 (2023년 4개 수준에서 12배 급증). 이는 대부분 인공지능(LLM) 기반 서지 생성 도구의 “환각(hallucination)” 때문인 것으로 지적된다. 한편, 연세대·고려대 등 국내 유수 대학들은 ‘학술용병’이라 불리는 해외 다작 연구자들을 대거 초빙하여 논문 수와 인용수를 부풀린 것으로 드러났다. 예컨대 중국 과학자는 2020–26년 연세대 소속으로 496편의 논문을 발표해 1만여 회 인용되는 성과를 올렸고, 고려대도 180여 명의 고인용 외국 석학 영입 후 THE 순위가 201–250위권에서 156위로 도약했다. 이러한 조치는 국내 대학들이 등한시한 연구윤리와 학문적 양심의 위기를 보여준다. 본글에서는 가짜 참조·AI 환각, 학술용병·논문공장의 실태와 대학평가 지표의 취약성을 분석하고, 이에 따른 윤리적·과학적 함의를 다룬다. 마지막으로 대학·저널·연구자가 취할 수 있는 대응 방안과 행동 지침을 제안한다.

가짜 참조문헌 확산과 인공지능 환각

Lancet 서한 그림에서 보듯, PubMed Central 수록 논문 10,000편당 포함된 가짜 참조문헌 수는 2023년 약 4개에서 2026년 1월에는 57개로 급증했다. 실제 통계에서 2026년 상반기에만 전체 논문의 약 0.36%(1/277편)가 존재하지 않는 논문을 인용했다. 톰팻자(Z.Topaz) 등은 이러한 급증이 2024년 중반 AI 작문 도구 사용과 맞물린다고 지적했다. 이들은 2년간 250만 편 참조를 AI로 검증해 4,406개의 완전 허구 참조를 찾아냈고, 해당 논문 대부분이 아직 유효한 상태라고 보고했다. 한편, Retraction Watch 취재에 따르면, 최근 인공지능을 사용해 논문을 작성하던 연구자들이 실제 존재하지 않는 논문을 ‘저널 자체’로 거론하는 참조사례도 발생했다. 네덜란드의 한 저널은 750단어 분량 편지글에 15개 참조 중 10개가 검색 불가 논문이었고, 그중 한 건은 해당 저널로 게재된 가상의 논문이었다. 이 논문은 2024년 말 학술대회 논문이었는데, 출판사는 “PubMed ID를 AI로 변환하면서 가짜 참조가 포함되었다”고 밝혔고 최종적으로 철회되었다. 이처럼 LLM 환각으로 인한 가짜 인용문헌은 일상화 우려에 이르렀다. Lancet 분석가들은 “참조문헌 전수 검증 기술” 도입과 “악용 시 논문 게재 거부” 등의 대책이 시급하다고 제안한다.

학술용병과 대학 순위 조작

최근 국내 언론은 서울대·연세대·고려대 등 상위권 대학들이 글로벌 평가지표를 높이기 위해 해외 다작 학자를 비전임 교수(겸임·특임)로 영입한 정황을 보도했다. 이들 중 상당수는 국내 체류나 강의를 거의 하지 않았고, 연구 교류도 없었다. 하지만 논문에 국내 대학 소속을 병기만 하면 해당 논문의 출판과 동시에 그 연구업적은 대학에 실적으로 인정된다. 예를 들어 연세대 YFL 프로그램의 해외 교수들은 연세대 소속으로 6년간 수백 편의 논문을 발표했다. 중국 둥난대 교수의 경우 2020–2026년에 496편의 논문(피인용 11,617회)을 연세대 소속으로 발표했고, 고려대는 2023년부터 국제 인용 지수 상위 연구자 180명을 K-클럽으로 임용하여 THE 순위가 2024년 200위권 밖에서 2026년 156위로 도약했다. 이러한 급격한 순위 상승은 각종 랭킹 지표가 연구 생산성과 국제화 정도를 기준으로 삼는 현 체제를 겨냥한 꼼수라는 비판을 불러일으켰다. 실제로 사우디아라비아에서는 명단관리업체 Clarivate가 부정행위로 적발된 1,000명의 다국적 소속 연구자를 고인용연구자(HCR) 명단에서 제외했으며, 한국 교육당국도 현재 QS 상위 400개 교내 10여곳에 대한 실태조사를 벌이고 있다. 그러나 국내에는 “겸임·연구부원 자격 요건”이나 “소속 표기 규정”을 법으로 제한하는 제도적 장치가 없어 대응이 난망하다.

세계 대학평가 지표의 허점

QS와 THE 등 주요 평가기관은 복수 소속표기를 허용해 각 기관에 실적을 동시에 반영한다. 즉 한 논문에 국내·해외 소속을 둘 이상 적으면 피인용수와 논문수가 각 대학의 점수로 누적된다. 또 국제화 지표(외국인 교원 비율, 해외 공동 연구 실적 등)도 평가 요소다. 대학들은 이런 평가모형의 허점을 악용해, 해외 석학에게 대면 교육·연구 의무 없이 명목상의 소속만 주고 인센티브를 지급했다. 언론 보도에 따르면 한 학술용병 교수는 논문 1편당 억대 이상의 성과급을 받기도 했다. 이 결과 국내 대학의 순위는 단기간에 급등했지만, 학문적 진실성은 크게 훼손됐다. 정부 역시 랭킹 상위대학 유치와 BK21 등 예산 배분 지표에 순위가 반영되면서 대학들이 ‘순위 올리기’에 매몰된 것이다. 그러나 이번 사태는 “순위 조작은 아니지만 비윤리적”이라는 민낯을 드러냈고, 과학 공동체 내부에 자성과 제도 개선 요구를 촉발했다.

논문공장과 연구부정의 확산

세계적으로 논문공장(paper mill) 조직들이 수년째 대규모로 허위 논문을 양산해 왔다. 2023년 한 저널사(Hindawi)는 8,000편 이상의 논문을 재논문(retraction) 처리했다고 밝혔다. 최근 PNAS 논문에서도 논문공장·브로커·사냥저널이 저품질 연구를 대량 생산하며, 이에 대응하는 철회 등 조치량보다 두 배 이상 빠른 속도로 늘어나고 있음이 확인되었다. 이들은 표절·데이터 조작·이미지 조작 등 다양한 수법을 동원하며 연구 결과를 “공장형”으로 찍어낸다. 미국∙유럽∙중동 등 여러 나라에서 적발된 논문공장 규모는 여전히 불투명하지만, 현재의 대응 속도로는 “넘쳐나는 욕조에서 숟가락으로 물 빼기”라는 평가까지 나오고 있다. 특히 2019~2023년 Hindawi 등의 출판사에서 3,000편 이상의 논문이 연속 철회된 사태는 문제의 심각성을 보여준다. 우리나라도 고교 교원·연구자들이 논문공장 사이트에 광고를 통해 유령논문 의뢰를 받았다는 보고가 나오고 있다(구체적 수치는 공개되지 않음). 이처럼 대학들이 순위경쟁에 집중하면서 상대적으로 논문 진위검증은 소홀해지고, 신뢰할 수 없는 연구 결과가 학계에 유입될 가능성이 커지고 있다.

윤리적·과학적 함의

가짜 인용·허위 논문 증가는 과학의 기초인 재현 가능성과 투명성을 위협한다. 연구자가 참조문헌 하나하나에 책임을 져야 하는데도 검증 없이 AI에 의존하거나 대량 복붙하는 관행이 만연하면, 잘못된 정보가 후속 연구로 전파될 수 있다. 학술용병·논문공장은 학계의 공정 경쟁 질서를 해치고, 자국 학문평판에도 부정적 영향을 미친다. 이번 사태에서 연세대·고려대 등의 행위는 “등록금 동결·학령인구 감소·국제학생 유치경쟁” 등의 구조적 난관 속에서 나온 일종의 도덕적 해이라는 평가를 받았다. 그러나 명백히 정당화되지 않는다. 궁극적으로 대학평가 지표가 외부 성과에 과도하게 연동되면서 생긴 부작용인 만큼, 평가 체계의 전면 재검토와 윤리 교육 강화가 시급하다.

대응 방안 및 점검 사항

저널·출판사 차원: 자동화된 참조 검증 시스템 도입. 예컨대 논문 제출 시 CrossRef나 PubMed API로 DOI, 출판정보를 확인하고, 일치하지 않으면 경고 또는 검토 강화할 수 있다. Taylor & Francis는 이미 문제적 참조를 잡기 위한 기술·인력에 투자하고, 심각한 경우 게재를 거부한다고 밝혔다. PLOS 등에서도 전사적 참조 무결성 검사 옵션을 검토 중이다. 학술지 운영자는 LLM 사용 정책을 명확히 하고, 편집·심사 과정에서 표절 및 참조 허위 여부를 철저히 점검해야 한다.
대학·기관 차원: 겸임교원 임용 시 실질적 교육·연구 기여 실적을 필수 검증한다. 교육부 조사의 뒤를 이어 대학 내부 감사도 강화해야 한다. 특히 겸·초빙교수 연구 참여 증빙(강의실 출강, 공동 논문, 프로젝트 참여 등) 제출을 의무화하고, 거짓이 확인되면 예산 반환 등 제재를 가해야 한다. 또한 BK21 등 정부지원 사업에서도 순위 활용 의혹을 차단하고, 연구 평가지표를 재설계해야 한다.
연구자·저자 차원: 연구자들은 LLM 도구 사용 시 참고문헌의 정확성을 반드시 직접 확인해야 한다. 레퍼런스 매니저(EndNote, Zotero, Mendeley 등)를 활용하면 수기로 발생할 수 있는 오류를 줄일 수 있다. 논문 작성 시 참고문헌 자동 생성 대신 직접 데이터베이스 검색 결과를 인용하고, 인용 도구를 숙지해야 한다. 학회와 과학기자재는 논문작성 교육과 데이터 윤리 워크숍을 통해 연구자들의 책임감을 높여야 한다.
평가기관·대중 인식 개선: QS·THE 등 글로벌 평가지표에서 다중 소속 문제를 없애고, 교육·교수활동 등 ‘내실’을 반영하도록 시스템 개혁을 검토해야 한다. 국내에서는 학계·시민사회가 대학평가 지표의 한계를 지적하고, 정부는 순위 위주 정책을 지양해야 한다.

Post Views: 297

Published

2026/05/08

Woo Jae Kim in Flyandbee, 김우재 (2014-) | 2026/05/08