디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

2025년 학술 논문, 전년 대비 가짜 인용 81% 급증... AI 에이전트가 원인

aimatters갤로그로 이동합니다. 2026.02.11 09:18:58
조회 510 추천 3 댓글 0


대형 언어모델(LLM)이 학술 연구에 널리 활용되면서, 존재하지 않는 논문을 인용하는 '유령 인용(ghost citation)' 문제가 심각한 수준으로 드러났다. 난카이대(Nankai University)와 칭화대(Tsinghua University) 공동 연구팀이 개발한 CITEVERIFIER 시스템을 통해 분석한 결과, 최신 AI 모델들이 생성한 학술 인용의 14%에서 최대 95%까지 실제로 존재하지 않는 허위 참고문헌인 것으로 확인됐다. 



GPT-5는 51%, 클로드4는 22%... 모델별 환각 인용률 편차 최대 6.7배 

연구팀은 GPT-5, 클로드4, 제미나이 등 13개 최신 LLM을 대상으로 컴퓨터 과학 40개 연구 분야에서 37만 5,440개의 인용을 생성하도록 한 뒤 진위를 검증했다. 그 결과 모든 모델이 허위 인용을 생성했으며, 환각 인용률은 딥시크의 14.23%부터 훈위안(Hunyuan)의 94.93%까지 약 6.7배 차이를 보였다. 특히 주목할 점은 GPT-5가 50.92%, 클로드4가 21.84%의 환각률을 기록해 최신 프리미엄 모델조차 신뢰할 수 없다는 사실이 입증됐다는 점이다. 

환각 인용의 패턴도 흥미롭다. AI 모델들은 실제 저자 이름, 그럴듯한 제목, 유명 학회명을 통계적으로 조합해 겉보기에는 완벽해 보이지만 실제로는 존재하지 않는 참고문헌을 만들어낸다. 2000년부터 2025년까지 생성된 인용을 분석한 결과, 최근 연도로 갈수록 환각 인용률이 급격히 증가해 2025년에는 98.75%에 달했다. 이는 LLM이 최신 논문을 선호적으로 환각 한다는 것을 의미한다. 


2025년 학술 논문, 전년 대비 80.9% 급증한 허위 인용 포함 

연구팀은 2020년부터 2025년까지 NeurIPS, ICML, IEEE S&P 등 최상위 AI/ML 및 보안 학회에 발표된 5만 6,381편의 논문에서 220만 개의 인용을 검증했다. 자동 검증 후 의심스러운 2,530개 인용을 16명의 연구진이 약 한 달간 수작업으로 재검증한 결과, 604편(1.07%)의 논문에서 739개의 확실한 허위 인용을 발견했다. 이 중 486편(0.86%)은 추적 불가능한 유령 인용을, 133편(0.24%)은 메타데이터 오류를 포함하고 있었다. 

시간에 따른 추세는 더욱 우려스럽다. 2020년부터 2024년까지 허위 인용률은 0.76%에서 0.98% 사이로 비교적 안정적이었으나, 2025년에는 1.61%로 급등했다. 이는 2020~2024년 평균(0.89%) 대비 80.9% 증가한 수치다. 특히 AI/ML 분야 학회가 보안 학회보다 절대적 허위 인용 건수가 훨씬 많았는데, 이는 AI 연구 커뮤니티에서 LLM 기반 도구를 더 일찍, 더 광범위하게 채택했기 때문으로 분석된다. 

더 심각한 것은 '반복되는 허위 인용' 현상이다. 연구팀은 동일한 잘못된 인용이 최대 16편의 독립적인 논문에 반복 등장하는 것을 확인했다. 예를 들어 "AugMix" 논문의 제목 오류가 AAAI, IJCAI, NeurIPS에 걸쳐 16편의 논문에 동일하게 나타났다. 이는 연구자들이 다른 논문의 참고문헌을 복사하면서 이미 포함된 오류까지 함께 전파하고 있음을 보여준다. 


연구자 87%가 AI 사용하지만, 41%는 BibTeX 검증 없이 복사 

연구팀은 94명의 연구자를 대상으로 설문조사를 실시해 인간의 검증 행동을 분석했다. 응답자의 87.2%가 연구에 AI 도구를 사용한다고 답했으며, AI 사용자 중 86.7%는 "항상 검증한다"고 주장했다. 그러나 실제 행동 데이터는 달랐다. 41.5%는 BibTeX 항목을 내용 확인 없이 복사-붙여넣기하며, 17.3%는 AI가 추천한 논문을 읽지 않고 인용했다. 의심스러운 참고문헌을 발견했을 때 44.4%는 개인적으로만 확인하거나 무시하는 등 아무런 조치를 취하지 않았다. 

리뷰어들의 검증도 허술하다. 설문에 응한 리뷰어 30명 중 76.7%는 참고문헌을 철저히 확인하지 않으며, 80.0%는 제출된 논문에서 허위 인용을 의심한 적이 없다고 답했다. 연구자의 74.5%는 현재 동료 심사 과정이 메타데이터 오류를 잡아내는 데 효과적이지 않다고 평가했다. 이는 저자와 리뷰어 모두 기본적으로 인용을 신뢰한다는 '신뢰 기반 규범(trust-by-default norm)'이 작동하고 있음을 보여준다. 

흥미롭게도 연구자들은 문제의 심각성을 인지하고 있다. 76.6%가 허위 인용을 '중대한 문제' 또는 '심각한 위기'로 여기며, 70.2%는 제출 시스템에 자동화된 DOI/참고문헌 검증 도구 도입을 강력히 지지했다. 그러나 책임 소재에 대해서는 91.5%가 저자에게 있다고 답해, 학회나 도구 개발자 등 다른 이해관계자들에 대한 압력을 오히려 감소시킬 수 있다는 우려가 제기된다. 



FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) 

Q1. 유령 인용이란 무엇이며 왜 문제인가요? 

A. 유령 인용은 AI가 생성한 실제로 존재하지 않는 허위 참고문헌입니다. 학술 논문에서 인용은 주장의 근거를 제공하는 신뢰 메커니즘인데, 존재하지 않는 논문을 인용하면 이 신뢰가 무너지고 과학적 진실이 왜곡됩니다. 연구자들이 이런 허위 인용을 추적하느라 시간을 낭비하고, 인용 그래프에 허위 정보가 쌓이면서 학술 커뮤니케이션 전체의 신뢰성이 훼손됩니다. 


Q2. AI가 허위 인용을 생성하는 이유는 무엇인가요? 

A. 대형 언어모델은 실제 데이터베이스를 검색하지 않고 통계적 패턴에 따라 텍스트를 생성합니다. 학술 인용은 엄격한 형식을 따르기 때문에 AI는 실제 저자명, 그럴듯한 제목, 유명 학회명 등을 조합해 겉으로는 완벽해 보이지만 실제로는 존재하지 않는 참고문헌을 쉽게 만들어냅니다. AI는 언어의 구조를 모방할 뿐 진실성은 고려하지 않기 때문입니다. 


Q3. 연구자들이 허위 인용을 막기 위해 무엇을 해야 하나요? 

A. AI가 생성한 모든 참고문헌을 제출 전에 반드시 검증해야 합니다. Google Scholar나 DBLP 같은 신뢰할 수 있는 데이터베이스에서 제목을 확인하고, DOI가 없거나 메타데이터가 일치하지 않으면 주의해야 합니다. BibTeX 항목을 확인 없이 복사-붙여넣기하는 습관을 피하고, 검색 기반 도구를 순수 생성 모델보다 우선적으로 사용하는 것이 좋습니다. 학회는 자동화된 인용 검증 시스템을 도입하고, AI 도구 개발자들은 검증된 출처에 기반한 검색 방식을 채택해야 합니다. 



기사에 인용된 논문 원문은 arXiv에서 확인 가능하다.

논문명: GHOSTCITE: A Large-Scale Analysis of Citation Validity in the Age of Large Language Models 

이미지 출처: 이디오그램 생성 

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다. 



추천 비추천

3

고정닉 0

0

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 내 돈 투자하고 싶게 만드는 CEO상 스타는? 운영자 26/03/02 - -
2127 "진정하세요" 이제 그만…오픈AI, 챗GPT의 '오글거리는' 말투 고친다 [4] aimatters갤로그로 이동합니다. 03.04 1508 0
2126 AI 보안 어드바이저가 틀린 답변을 준다면? 챗GPT와 클로드의 위험한 실수들 aimatters갤로그로 이동합니다. 03.04 16 0
2125 말로 코딩하는 시대 열렸다…앤트로픽 '클로드 코드'에 음성 모드 탑재 aimatters갤로그로 이동합니다. 03.04 20 0
2124 AI가 연구자 대신 논문 댓글까지 분류한다, 단돈 6천 원으로 5만 건을 aimatters갤로그로 이동합니다. 03.04 16 0
2123 챗GPT 지우고 클로드로 갈아탄다…데이터 이전부터 계정 삭제까지 한 번에 aimatters갤로그로 이동합니다. 03.04 24 0
2122 AI가 시각장애인의 'DIY 설명서' 읽어주면 절반은 틀린다 aimatters갤로그로 이동합니다. 03.04 12 0
2121 트럼프, 앤트로픽 모델 정부 사용 금지령… 오픈AI는 국방부 계약 체결 aimatters갤로그로 이동합니다. 03.03 18 0
2120 "데스크톱도 AI 비서 시대"… AMD, 세계 최초 코파일럿+ PC용 데스크톱 프로세서 공개 aimatters갤로그로 이동합니다. 03.03 20 0
2119 "검색 AI의 반란"…퍼플렉시티, AI 모델들을 한데 묶은 '디지털 노동자' 공개 aimatters갤로그로 이동합니다. 03.03 21 0
2118 레노버, MWC 2026서 AI가 알아서 맞춰주는 PC 시대 열었다 aimatters갤로그로 이동합니다. 03.03 49 0
2117 챗GPT가 소설을 먹고 자란다? AI 학습 데이터에 숨겨진 '픽션의 비밀' aimatters갤로그로 이동합니다. 03.03 18 0
2116 병원 설문지가 대화로 바뀐다…GPT가 환자 문진표를 대신 작성하는 시대 aimatters갤로그로 이동합니다. 03.03 11 0
2115 AI가 장애 혐오 표현을 찾아내고 고쳐준다면? 100명의 장애인이 평가한 결과 aimatters갤로그로 이동합니다. 03.03 11 0
2114 저커버그, 프라다 패션쇼 전면 착석…메타 AI 안경 명품 버전 나오나 [2] aimatters갤로그로 이동합니다. 02.27 1123 2
2113 구글, 이미지 생성 모델 '나노 바나나 2' 공개…4K 해상도에 속도까지 잡았다 aimatters갤로그로 이동합니다. 02.27 68 3
2112 잭 도시, 직원 절반 잘랐다…"당신 회사도 곧 같은 길 걷게 될 것" aimatters갤로그로 이동합니다. 02.27 48 1
2111 챗GPT가 강박장애 환자를 더 아프게 만든다, '안심 로봇'의 위험한 진실 [2] aimatters갤로그로 이동합니다. 02.27 720 0
2110 AI 데이터센터의 '친환경' 선언, 전력망을 들여다보면 허상이다 aimatters갤로그로 이동합니다. 02.27 42 0
2109 별점만 믿다간 낭패! ChatGPT가 470만 개 리뷰를 파헤쳐 밝혀낸 '맛집의 진짜 조건' aimatters갤로그로 이동합니다. 02.27 44 0
2108 "ChatGPT가 편향됐다"는 말 한마디에 설득력 28% 급락 [10] aimatters갤로그로 이동합니다. 02.26 2516 4
2107 챗GPT가 통계학 교육을 뒤흔들고 있다: 대학 강의실에서 벌어지는 AI 혁명 aimatters갤로그로 이동합니다. 02.26 78 0
2106 월 20달러짜리 챗GPT로 수학 난제 풀었다…'바이브 증명'의 충격적 실험 [13] aimatters갤로그로 이동합니다. 02.26 2525 19
2105 앤트로픽, AI 에이전트 개발 스타트업 버셉트 인수…창업자 한명은 메타로 aimatters갤로그로 이동합니다. 02.26 37 0
2104 제미나이, 안드로이드에서 택시 호출·음식 배달 주문까지 자동화한다... 한국서도 적용 aimatters갤로그로 이동합니다. 02.26 64 0
2103 "AI 개발은 기타 배우기와 같다"…오픈클로 개발자가 전하는 AI 빌더 생존법 aimatters갤로그로 이동합니다. 02.26 75 0
2102 975g으로 AI 정복…한국레노버, 요가 11세대 4종 출시 aimatters갤로그로 이동합니다. 02.26 47 0
2101 AI가 내 말을 못 믿는다고? 음성 AI의 충격적인 편향 실험 결과 [2] aimatters갤로그로 이동합니다. 02.25 695 2
2100 GPT-5도 이런 실수를 한다고? AI가 '알면서도 틀리는' 황당한 이유 [14] aimatters갤로그로 이동합니다. 02.25 1805 6
2099 AI도 못 깨는 게임이 있다? 챗GPT·클로드·제미나이, 70년대 텍스트 게임 줄줄이 실패 [2] aimatters갤로그로 이동합니다. 02.25 645 5
2098 오픈AI 투자자, 앤트로픽도 찍었다…VC 업계, 경쟁사에 투자하지 않는 '투자 충성도' 사실상 붕괴 aimatters갤로그로 이동합니다. 02.25 53 0
2097 " 美 연준도 AI 시대로 간다"…월러 이사, AI 전면 도입 전략 공개 aimatters갤로그로 이동합니다. 02.25 44 0
2096 AI가 플레이리스트 짜준다...스포티파이 리스트 자동생성 기능 영국·호주 등으로 확대 aimatters갤로그로 이동합니다. 02.25 42 0
2095 2028년 붕괴 시나리오로 전세계 공포, AI가 완벽하게 성공할수록 경제는 무너진다 [1] aimatters갤로그로 이동합니다. 02.24 142 0
2094 AI가 "생각을 줄이면" 오히려 더 똑똑해진다? 토큰 예산과 LLM 추론의 역설 aimatters갤로그로 이동합니다. 02.24 68 0
2093 AI 전쟁 시뮬레이션, 가장 먼저 핵 투하를 지시한 AI 모델은? aimatters갤로그로 이동합니다. 02.24 67 0
2092 AI가 교사보다 공정한 채점자가 될 수 있을까? GPT, 클로드, 제미나이의 교육 평가 실험 aimatters갤로그로 이동합니다. 02.24 41 1
2091 앤트로픽 "중국 AI 3사, 가짜 계정 2만4천 개로 클로드 기술 훔쳐갔다" aimatters갤로그로 이동합니다. 02.24 73 0
2090 "하루 한 시간이면 AI를 직접 활용하라. 주변의 99%보다 앞서갈 수 있다"…AI 스타트업 CEO의 경고 aimatters갤로그로 이동합니다. 02.24 69 0
2089 오픈AI, 스마트 스피커·안경·조명까지…AI 하드웨어 제국 꿈꾼다 aimatters갤로그로 이동합니다. 02.24 63 0
2088 다쏘시스템, AI 전문가 '버추얼 동반자' 공개…인간과 AI의 산업 협업 시대 열린다 aimatters갤로그로 이동합니다. 02.24 43 0
2087 AI 안전장치도 '세탁'된다? 제미나이·클로드도 뚫렸다 aimatters갤로그로 이동합니다. 02.23 47 0
2086 AI가 사각형을 인식할 수 있을까? 클로드·챗GPT·제미나이 '공간 인식' 충격 실험 aimatters갤로그로 이동합니다. 02.23 44 0
2085 AI 로봇이 나를 설득한다? 챗GPT가 물리치료 거부 환자를 설득하는 방법 aimatters갤로그로 이동합니다. 02.23 41 0
2084 [신간] 난치병·빚에서 탈출한 30대 파이어족의 <버릴수록 부자 되는 미니멀리즘 재테크> aimatters갤로그로 이동합니다. 02.23 51 0
2083 한 질문에 AI 4개가 토론한다…xAI, '그록 4.20' 공개 aimatters갤로그로 이동합니다. 02.23 41 1
2082 AI가 인간을 고용하는 시대 열렸다…"클로드(Claude)가 내 상사라면 이상적일 것" aimatters갤로그로 이동합니다. 02.23 52 0
2081 "광고 대행사는 이제 필요 없다 우리에게 바로 광고해"…오픈AI 임원의 도발적 선언 aimatters갤로그로 이동합니다. 02.23 99 0
2080 "일기 쓰기 귀찮다고요?" AI가 대신 물어봐 주는 일기 앱 '블루닙' 출시 aimatters갤로그로 이동합니다. 02.23 45 0
2079 AI 코미디언이 인간보다 더 웃기다고? ‘기계다움’이 유머의 새 무기가 된다 [14] aimatters갤로그로 이동합니다. 02.20 1551 2
2078 AI는 이제 '알아서 척척'… 2026년, 당신의 직장과 일상을 바꿀 AI의 민낯 aimatters갤로그로 이동합니다. 02.20 71 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2