AI가 짠 코드는 어디에 숨어 있을까. 정답은 '숨지 않고 그냥 적혀 있다'이다. 오픈소스 개발자들은 주석과 커밋 메시지, 문서 파일에 "이 부분은 챗GPT가 만들었다", "Copilot이 짜준 걸 버그 고쳤다"며 스스로 AI 사용 사실을 기록하고 있다. 독일 하이델베르크 대학과 일본 규슈 대학 등 국제 공동 연구진이 2026년 4월에 공개한 '오픈소스 소프트웨어에서의 자기 인정형 생성형 AI 사용(Self-Admitted GenAI Usage)' 연구는 깃허브(GitHub) 저장소 20만 7,062개를 전수 조사해 이런 '자기 고백' 1,292건을 찾아냈다. 독자가 매일 사용하는 웹사이트, 앱, 소프트웨어 뒤편에 AI가 얼마나 깊숙이 들어와 있는지 보여주는 데이터다.
20만 저장소에서 찾아낸 1,292건의 AI 사용 고백
자기 인정형 생성형 AI 사용(Self-Admitted GenAI Usage)이란 개발자가 소프트웨어의 소스 코드나 변경 기록, 설명 문서에 "이 내용은 챗GPT나 깃허브 코파일럿(Copilot)으로 만들었다"라고 스스로 밝혀둔 흔적을 말한다.
연구진은 파이썬, 자바스크립트, 타입스크립트, 자바, C# 다섯 개 언어로 작성된 깃허브 저장소 20만 7,062개 중 실제 개발이 활발한 1만 4,785개 프로젝트를 추려 전수 조사했다. 그 결과 156개 저장소에서 1,292건의 명시적 AI 사용 고백이 발견됐다.
숫자만 보면 적어 보일 수 있지만, 연구진은 이것이 '빙산의 일각'이라고 강조한다. 대부분의 개발자는 AI를 쓰고도 굳이 적어두지 않기 때문에, 실제 사용량은 훨씬 크다는 뜻이다. 즉, 이번에 드러난 1,292건은 "쓰고 있지만 숨기지 않은 사람들"의 기록에 불과하다.
코드 생성·번역·리팩토링, 그리고 한 프로젝트의 AI 문장 1,000건
가장 많은 AI 사용 유형은 코드 생성이었다. 개발자가 "이런 기능을 만들고 싶다"라고 말로 설명하면 AI가 실제 작동하는 코드로 바꿔주는 작업으로, 1,292건 중 105건이 여기에 해당했다. 두 번째는 번역(50건)이다. 한 개발자는 README 파일에 "영어 실력이 부족해 영문 번역은 모두 챗GPT에 맡겼다. 이 문장 포함"이라고 적어두기도 했다. 세 번째는 기존 코드를 깔끔하게 다시 쓰는 리팩토링(29건)이다. 한 개발자는 간단히 "탭 잊었네. 고마워, Copilot"이라는 커밋 메시지를 남겼다.
가장 눈길을 끄는 건 한 프로젝트 이야기다. 가상자산 거래소로 잘 알려진 팬케이크스왑(PancakeSwap)의 프론트엔드 저장소 한 곳에서만 AI가 작성한 풀 리퀘스트(Pull Request) 설명이 1,000번이나 그대로 커밋 메시지로 쓰였다. 풀 리퀘스트는 개발자가 "이런 부분을 고쳤으니 반영해달라"고 올리는 제안서고, 커밋 메시지는 그 변경 내용이 프로젝트의 공식 역사로 남는 요약문이다. 즉, 한 유명 프로젝트의 공식 변경 기록 수천 줄이 사실상 AI가 쓴 문장인 셈이다. 대형 머신러닝 프레임워크 파이토치(PyTorch)와 GraphQL 엔진 하수라(Hasura) 같은 유명 프로젝트에서도 비슷한 패턴이 발견됐다.
"깃허브 코파일럿을 믿지 마라" 경고가 코드에 남는 이유
AI가 짠 코드가 완벽하지 않다는 사실도 기록으로 남았다. 연구진이 분석한 1,292건 중 20건은 "AI가 만든 결과물을 사람이 다시 고쳤다"는 흔적이었다. 이 중 9건은 버그 수정, 2건은 AI가 만든 주석 삭제, 1건은 통째로 되돌리기였다.
한 개발자는 AI가 짠 코드 위에 "참고: 깃허브 코파일럿을 믿지 마라. z축을 위 방향으로 쓸 수 있다"라는 경고를 남겼다. 또 다른 개발자는 자신의 커밋을 통째로 되돌리면서 "'챗GPT' 되돌림. 이 커밋은 71e3...를 되돌린다"고 적었다.
웹 개발자들이 많이 쓰는 프레임워크 넥스트닷제이에스(Next.js)에서는 한 기여자가 "Copilot에 너무 의존한 나머지 작업이 느려지고 지저분해졌다"며, AI가 만든 검증 로직을 손으로 다시 짜 올린 사례도 발견됐다. AI가 빨리 만들어주긴 하지만, 사람이 한 번 더 확인하고 고치는 단계가 필수라는 현실이 코드 주석에 그대로 적혀 있는 셈이다.
AI 전면 금지 프로젝트 vs README 자동 작성 권장 프로젝트
연구진은 AI 사용 규칙을 공식 문서로 정해둔 13개 프로젝트를 찾아 금지, 제한, 권장 세 부류로 나눴다. 자바 기반 테스트 도구 제이큐윅(jqwik)은 기여자 서약서에 "깃허브 코파일럿이나 비슷한 거대 언어 모델(LLM)로 기여물을 만든 적이 없음을 확인해야 한다"고 명시해뒀다.
이유는 "AI 학습 데이터의 저작권 문제가 아직 법적으로 정리되지 않았다"는 것이다. 웹 컴포넌트 도구 슈레이스(Shoelace)도 "AI가 어떤 코드로 학습했는지, 그 라이선스가 어떻게 되는지 법정에서 검증된 적이 없어 받지 않는다"고 선언했다.
반면 오픈소스 UI 프레임워크 아발로니아(Avalonia)는 "영어가 모국어가 아니라면 챗GPT로 풀 리퀘스트 설명을 써도 좋다"고 권장한다. 스프링 CLI(Spring CLI) 프로젝트는 아예 "챗GPT로 README를 자동 생성하라"고 안내하며 관련 기능까지 만들어뒀다. 같은 오픈소스 세계 안에서도 AI를 바라보는 태도가 정반대로 갈라진다는 의미다.
개발자 설문에서 한 응답자는 "AI 사용은 매우 윤리적인 문제다. 규정이 있어야 입장을 명확히 할 수 있다"고 답한 반면, 다른 응답자는 "규정을 너무 엄격히 하면 혁신을 막고 생산성을 떨어뜨린다"고 반박했다.
'AI가 코드 품질 떨어뜨린다' 주장, 데이터는 다르게 말한다
이 연구의 또 다른 축은 업계에서 널리 인용된 깃클리어(GitClear) 보고서에 대한 반박이다. 깃클리어는 2024년 "AI 도입 이후 코드 처닝(churn)이 늘었고, 이는 코드 품질 저하의 신호"라고 주장해 큰 반향을 일으켰다. 코드 처닝이란 어떤 줄의 코드가 쓰인 지 14일 안에 다시 바뀌거나 지워지는 비율로, 높을수록 "처음부터 제대로 짜지 못한 코드"가 많다는 해석이 가능하다.
연구진은 AI 사용 흔적이 발견된 151개 저장소에서 첫 AI 사용 시점을 기준으로 전후 360일씩 코드 처닝을 비교했다. 결과는 깃클리어의 주장과 반대였다. 파일 단위 평균 처닝은 17%에서 6%로, 줄 단위 처닝은 68%에서 50%로 오히려 감소했다.
물론 저장소별 편차는 있어 일부 프로젝트에서는 AI 도입 이후 처닝이 증가하는 패턴도 나타났다. 특히 AI가 코드를 새로 '생성'하는 작업은 다른 유형의 작업보다 재작업 필요성이 높았다.
다만 "AI 때문에 전반적인 코드 품질이 떨어진다"는 식의 단정적 결론은 이번 데이터로는 지지되지 않았다. 연구진은 "AI 도입이 코드 품질에 미치는 영향은 프로젝트 맥락에 따라 다르며, 일률적으로 부정적이라고 보기 어렵다"고 결론 내렸다.
드러나는 AI 지문, 커지는 투명성 요구
이번 연구가 던지는 메시지는 단순하다. AI는 이미 오픈소스 세계의 공식 역사에 흔적을 남기고 있고, 어떤 개발자는 이를 숨기지 않고 기록으로 남긴다. 번역처럼 "내가 못하는 일을 AI가 대신해줬다"고 당당히 밝히는 사례가 늘어나는 것은 새로운 기술 문화의 신호일 수 있다.
반면 팬케이크스왑처럼 한 프로젝트에서 1,000번 반복되는 AI 생성 문장이 공식 기록으로 남는 현상은, "내가 읽고 있는 이 문서, 정말 사람이 쓴 건가?" 하는 질문을 일상으로 끌어들인다.
앞으로 일반 사용자가 마주할 소프트웨어, 앱, 문서 상당수가 AI의 손을 거쳤을 가능성은 점점 커질 전망이며, '어디까지를 AI가 만들었는지 표시할지'에 대한 사회적 합의는 이제 막 시작 단계다.
FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q1. '자기 인정형 생성형 AI 사용'이란 무엇을 말하나요?
개발자가 소프트웨어의 소스 코드, 변경 기록, 설명 문서에 "이 부분은 챗GPT나 깃허브 코파일럿 같은 AI로 만들었다"고 스스로 적어둔 흔적을 말합니다. AI가 만든 코드는 사람이 쓴 코드와 구분이 거의 불가능하기 때문에, 이런 '자기 고백'은 연구자들이 AI 사용 실태를 직접 관찰할 수 있는 몇 안 되는 단서 중 하나입니다.
Q2. AI가 짠 코드가 사람이 짠 코드보다 품질이 떨어지나요?
이번 연구 결과만 놓고 보면 "반드시 그렇지는 않다"입니다. 151개 저장소에서 AI 도입 전후 코드 수정 비율을 비교한 결과, 오히려 전체 평균 수정 비율은 감소했습니다. 다만 일부 프로젝트에서는 AI가 코드를 새로 생성하는 작업에서 재작업이 늘어나는 경향이 관찰돼, 사람의 검토는 여전히 필요합니다.
Q3. 제가 쓰는 오픈소스 프로그램에도 AI가 만든 부분이 있을 수 있나요?
가능성이 큽니다. 이번 연구에서 분석된 20만 이상의 저장소 중 156곳에서만 '명시적' AI 사용 고백이 발견됐지만, 대부분 개발자는 AI 사용을 기록하지 않기 때문에 실제 사용 프로젝트 수는 훨씬 많을 것으로 추정됩니다. 번역된 README 문서, 자동 작성된 변경 내역, 간단한 유틸리티 코드 등이 AI의 손을 거쳤을 가능성이 있습니다.
기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다. 리포트명: Self-Admitted GenAI Usage in Open-Source Software 이미지 출처: AI 생성 콘텐츠 해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.