'AI가 썼다'고 당당히 적힌 코드 1,292건...깃허브 20만 프로젝트 뒤진 연구의 충격

aimatters · 2026.04.24 11:00:11

AI가 짠 코드는 어디에 숨어 있을까. 정답은 '숨지 않고 그냥 적혀 있다'이다. 오픈소스 개발자들은 주석과 커밋 메시지, 문서 파일에 "이 부분은 챗GPT가 만들었다", "Copilot이 짜준 걸 버그 고쳤다"며 스스로 AI 사용 사실을 기록하고 있다. 독일 하이델베르크 대학과 일본 규슈 대학 등 국제 공동 연구진이 2026년 4월에 공개한 '오픈소스 소프트웨어에서의 자기 인정형 생성형 AI 사용(Self-Admitted GenAI Usage)' 연구는 깃허브(GitHub) 저장소 20만 7,062개를 전수 조사해 이런 '자기 고백' 1,292건을 찾아냈다. 독자가 매일 사용하는 웹사이트, 앱, 소프트웨어 뒤편에 AI가 얼마나 깊숙이 들어와 있는지 보여주는 데이터다.

20만 저장소에서 찾아낸 1,292건의 AI 사용 고백

자기 인정형 생성형 AI 사용(Self-Admitted GenAI Usage)이란 개발자가 소프트웨어의 소스 코드나 변경 기록, 설명 문서에 "이 내용은 챗GPT나 깃허브 코파일럿(Copilot)으로 만들었다"라고 스스로 밝혀둔 흔적을 말한다.

연구진은 파이썬, 자바스크립트, 타입스크립트, 자바, C# 다섯 개 언어로 작성된 깃허브 저장소 20만 7,062개 중 실제 개발이 활발한 1만 4,785개 프로젝트를 추려 전수 조사했다. 그 결과 156개 저장소에서 1,292건의 명시적 AI 사용 고백이 발견됐다.

숫자만 보면 적어 보일 수 있지만, 연구진은 이것이 '빙산의 일각'이라고 강조한다. 대부분의 개발자는 AI를 쓰고도 굳이 적어두지 않기 때문에, 실제 사용량은 훨씬 크다는 뜻이다. 즉, 이번에 드러난 1,292건은 "쓰고 있지만 숨기지 않은 사람들"의 기록에 불과하다.

코드 생성·번역·리팩토링, 그리고 한 프로젝트의 AI 문장 1,000건

가장 많은 AI 사용 유형은 코드 생성이었다. 개발자가 "이런 기능을 만들고 싶다"라고 말로 설명하면 AI가 실제 작동하는 코드로 바꿔주는 작업으로, 1,292건 중 105건이 여기에 해당했다. 두 번째는 번역(50건)이다. 한 개발자는 README 파일에 "영어 실력이 부족해 영문 번역은 모두 챗GPT에 맡겼다. 이 문장 포함"이라고 적어두기도 했다. 세 번째는 기존 코드를 깔끔하게 다시 쓰는 리팩토링(29건)이다. 한 개발자는 간단히 "탭 잊었네. 고마워, Copilot"이라는 커밋 메시지를 남겼다.

가장 눈길을 끄는 건 한 프로젝트 이야기다. 가상자산 거래소로 잘 알려진 팬케이크스왑(PancakeSwap)의 프론트엔드 저장소 한 곳에서만 AI가 작성한 풀 리퀘스트(Pull Request) 설명이 1,000번이나 그대로 커밋 메시지로 쓰였다. 풀 리퀘스트는 개발자가 "이런 부분을 고쳤으니 반영해달라"고 올리는 제안서고, 커밋 메시지는 그 변경 내용이 프로젝트의 공식 역사로 남는 요약문이다. 즉, 한 유명 프로젝트의 공식 변경 기록 수천 줄이 사실상 AI가 쓴 문장인 셈이다. 대형 머신러닝 프레임워크 파이토치(PyTorch)와 GraphQL 엔진 하수라(Hasura) 같은 유명 프로젝트에서도 비슷한 패턴이 발견됐다.

"깃허브 코파일럿을 믿지 마라" 경고가 코드에 남는 이유

AI가 짠 코드가 완벽하지 않다는 사실도 기록으로 남았다. 연구진이 분석한 1,292건 중 20건은 "AI가 만든 결과물을 사람이 다시 고쳤다"는 흔적이었다. 이 중 9건은 버그 수정, 2건은 AI가 만든 주석 삭제, 1건은 통째로 되돌리기였다.

한 개발자는 AI가 짠 코드 위에 "참고: 깃허브 코파일럿을 믿지 마라. z축을 위 방향으로 쓸 수 있다"라는 경고를 남겼다. 또 다른 개발자는 자신의 커밋을 통째로 되돌리면서 "'챗GPT' 되돌림. 이 커밋은 71e3...를 되돌린다"고 적었다.

웹 개발자들이 많이 쓰는 프레임워크 넥스트닷제이에스(Next.js)에서는 한 기여자가 "Copilot에 너무 의존한 나머지 작업이 느려지고 지저분해졌다"며, AI가 만든 검증 로직을 손으로 다시 짜 올린 사례도 발견됐다. AI가 빨리 만들어주긴 하지만, 사람이 한 번 더 확인하고 고치는 단계가 필수라는 현실이 코드 주석에 그대로 적혀 있는 셈이다.

AI 전면 금지 프로젝트 vs README 자동 작성 권장 프로젝트

연구진은 AI 사용 규칙을 공식 문서로 정해둔 13개 프로젝트를 찾아 금지, 제한, 권장 세 부류로 나눴다. 자바 기반 테스트 도구 제이큐윅(jqwik)은 기여자 서약서에 "깃허브 코파일럿이나 비슷한 거대 언어 모델(LLM)로 기여물을 만든 적이 없음을 확인해야 한다"고 명시해뒀다.

이유는 "AI 학습 데이터의 저작권 문제가 아직 법적으로 정리되지 않았다"는 것이다. 웹 컴포넌트 도구 슈레이스(Shoelace)도 "AI가 어떤 코드로 학습했는지, 그 라이선스가 어떻게 되는지 법정에서 검증된 적이 없어 받지 않는다"고 선언했다.

반면 오픈소스 UI 프레임워크 아발로니아(Avalonia)는 "영어가 모국어가 아니라면 챗GPT로 풀 리퀘스트 설명을 써도 좋다"고 권장한다. 스프링 CLI(Spring CLI) 프로젝트는 아예 "챗GPT로 README를 자동 생성하라"고 안내하며 관련 기능까지 만들어뒀다. 같은 오픈소스 세계 안에서도 AI를 바라보는 태도가 정반대로 갈라진다는 의미다.

개발자 설문에서 한 응답자는 "AI 사용은 매우 윤리적인 문제다. 규정이 있어야 입장을 명확히 할 수 있다"고 답한 반면, 다른 응답자는 "규정을 너무 엄격히 하면 혁신을 막고 생산성을 떨어뜨린다"고 반박했다.

'AI가 코드 품질 떨어뜨린다' 주장, 데이터는 다르게 말한다

이 연구의 또 다른 축은 업계에서 널리 인용된 깃클리어(GitClear) 보고서에 대한 반박이다. 깃클리어는 2024년 "AI 도입 이후 코드 처닝(churn)이 늘었고, 이는 코드 품질 저하의 신호"라고 주장해 큰 반향을 일으켰다. 코드 처닝이란 어떤 줄의 코드가 쓰인 지 14일 안에 다시 바뀌거나 지워지는 비율로, 높을수록 "처음부터 제대로 짜지 못한 코드"가 많다는 해석이 가능하다.

연구진은 AI 사용 흔적이 발견된 151개 저장소에서 첫 AI 사용 시점을 기준으로 전후 360일씩 코드 처닝을 비교했다. 결과는 깃클리어의 주장과 반대였다. 파일 단위 평균 처닝은 17%에서 6%로, 줄 단위 처닝은 68%에서 50%로 오히려 감소했다.

물론 저장소별 편차는 있어 일부 프로젝트에서는 AI 도입 이후 처닝이 증가하는 패턴도 나타났다. 특히 AI가 코드를 새로 '생성'하는 작업은 다른 유형의 작업보다 재작업 필요성이 높았다.

다만 "AI 때문에 전반적인 코드 품질이 떨어진다"는 식의 단정적 결론은 이번 데이터로는 지지되지 않았다. 연구진은 "AI 도입이 코드 품질에 미치는 영향은 프로젝트 맥락에 따라 다르며, 일률적으로 부정적이라고 보기 어렵다"고 결론 내렸다.

드러나는 AI 지문, 커지는 투명성 요구

이번 연구가 던지는 메시지는 단순하다. AI는 이미 오픈소스 세계의 공식 역사에 흔적을 남기고 있고, 어떤 개발자는 이를 숨기지 않고 기록으로 남긴다. 번역처럼 "내가 못하는 일을 AI가 대신해줬다"고 당당히 밝히는 사례가 늘어나는 것은 새로운 기술 문화의 신호일 수 있다.

반면 팬케이크스왑처럼 한 프로젝트에서 1,000번 반복되는 AI 생성 문장이 공식 기록으로 남는 현상은, "내가 읽고 있는 이 문서, 정말 사람이 쓴 건가?" 하는 질문을 일상으로 끌어들인다.

앞으로 일반 사용자가 마주할 소프트웨어, 앱, 문서 상당수가 AI의 손을 거쳤을 가능성은 점점 커질 전망이며, '어디까지를 AI가 만들었는지 표시할지'에 대한 사회적 합의는 이제 막 시작 단계다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. '자기 인정형 생성형 AI 사용'이란 무엇을 말하나요?

개발자가 소프트웨어의 소스 코드, 변경 기록, 설명 문서에 "이 부분은 챗GPT나 깃허브 코파일럿 같은 AI로 만들었다"고 스스로 적어둔 흔적을 말합니다. AI가 만든 코드는 사람이 쓴 코드와 구분이 거의 불가능하기 때문에, 이런 '자기 고백'은 연구자들이 AI 사용 실태를 직접 관찰할 수 있는 몇 안 되는 단서 중 하나입니다.

Q2. AI가 짠 코드가 사람이 짠 코드보다 품질이 떨어지나요?

이번 연구 결과만 놓고 보면 "반드시 그렇지는 않다"입니다. 151개 저장소에서 AI 도입 전후 코드 수정 비율을 비교한 결과, 오히려 전체 평균 수정 비율은 감소했습니다. 다만 일부 프로젝트에서는 AI가 코드를 새로 생성하는 작업에서 재작업이 늘어나는 경향이 관찰돼, 사람의 검토는 여전히 필요합니다.

Q3. 제가 쓰는 오픈소스 프로그램에도 AI가 만든 부분이 있을 수 있나요?

가능성이 큽니다. 이번 연구에서 분석된 20만 이상의 저장소 중 156곳에서만 '명시적' AI 사용 고백이 발견됐지만, 대부분 개발자는 AI 사용을 기록하지 않기 때문에 실제 사용 프로젝트 수는 훨씬 많을 것으로 추정됩니다. 번역된 README 문서, 자동 작성된 변경 내역, 간단한 유틸리티 코드 등이 AI의 손을 거쳤을 가능성이 있습니다.

기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다.
리포트명: Self-Admitted GenAI Usage in Open-Source Software
이미지 출처: AI 생성 콘텐츠
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

인기 기사

번호	제목	글쓴이	작성일	조회	추천
설문	메시지 읽씹 잘 할 것 같은 이미지의 스타는?	운영자	26/04/20	-	-
2529	크리테오, 'AI 기반 커머스' 비전 공개... 에이전틱 추천 서비스·MCP 인프라 등 로드맵 제시	aimatters	11:00	7	0
	'AI가 썼다'고 당당히 적힌 코드 1,292건...깃허브 20만 프로젝트 뒤진 연구의 충격	aimatters	11:00	225	1
2527	마케팅 업계 AI 대응 온도차 극명, 리더 68%는 'AI 검색 대비 완료' vs. 실무자 26%만 실행중	aimatters	11:00	5	0
2526	솔트웨어, AWS와 '마이그레이션 퀵스타트 데이' 개최... 파고다 등 실사례 공유	aimatters	11:00	5	0
2525	DJI, 입문용 카메라 드론 'Lito X1·Lito 1' 국내 출시... 전방위 장애물 감지 기본 탑재	aimatters	11:00	5	0
2524	'둠스크롤링은 AI가 대신'... 스타트업 노스크롤, SMS 뉴스 봇 공개	aimatters	11:00	5	0
2523	시놉시스·TSMC, AI 반도체 차세대 시스템 공동 개발 확대... 설계와 생산 동시에 끝낸다	aimatters	11:00	8	0
2522	오픈AI, 잇따른 총격사건 연루 의혹으로 형사 수사 대상에	aimatters	11:00	5	0
2521	밀(Mill), 구글 AI 퓨처스 펀드 합류... 제미나이로 음식물 쓰레기 잡는다	aimatters	11:00	5	0
2520	오픈AI, 개인정보 자동 마스킹해 지워주는 모델 '프라이버시 필터' 공개 "이제는 보안도 챗GPT"	aimatters	11:00	6	0
2519	미 백악관 "중국이 산업적 규모로 미국 AI 기술을 훔쳐가고 있다" 공개 비판	aimatters	11:00	6	0
2518	망한 줄 알았던 인텔, 1분기 '어닝 서프라이즈'... AI CPU 수요가 반전 견인	aimatters	11:00	8	0
2517	메타, 신 모델 발표 직후 직원 10% 감원 발표... AI 투자 재원 마련 목표	aimatters	11:00	6	0
2516	오픈AI, GPT-5.5 출시... 에이전트 시대 맞춰 다단계 작업 역량 강화	aimatters	11:00	6	0
2515	GPT-5도 어린이 종이접기 문제에서 길을 잃었다	aimatters	04.23	23	0
2514	AI에게 접시 가져다달라 했더니 냉장고부터 연 이유	aimatters	04.23	26	0
2513	알리바바 클라우드, 아태 IaaS 점유율 22.5%로 1위 유지… 글로벌 7.7%까지 상승	aimatters	04.23	17	0
2512	애피어, 에이전틱 AI로 글로벌 여행 플랫폼 '오미오' 유럽 21개국 확장 견인	aimatters	04.23	12	0
2511	퀀텀에이아이, 구글 터보퀀트 넘는 차세대 초압축 기술 '퀀텀퀀트' 공개… "AI 메모리 장벽 돌파"	aimatters	04.23	14	0
2510	테슬라, 판매량 둔화에도 1분기 영업이익 컨센서스 상회… 에너지 저장은 38% 감소	aimatters	04.23	12	0
2509	X, Grok 기반 '커스텀 타임라인' 출시… 커뮤니티 기능은 종료	aimatters	04.23	14	0
2508	구글, '워크스페이스 스튜디오' 전면 공개… "명령어 한 줄로 AI 에이전트 제작"	aimatters	04.23	11	0
2507	메타, 美 직원 PC에 마우스·키보드 추적 도구 설치… "AI 에이전트 학습용"	aimatters	04.23	14	0
2506	xAI Grok, 접속 장애·응답 지연 속출… "공식 대시보드는 정상"	aimatters	04.23	17	0
2505	마이크로소프트, Edge 브라우저 'Copilot 스타일'로 전면 개편 공식화	aimatters	04.23	12	0
2504	구글 "제미나이 기반 새 Siri, 2026년 내 출시" 공식 확인	aimatters	04.23	17	0
2503	구글, Vertex AI 대체한 '제미나이 엔터프라이즈 에이전트 플랫폼' 공식 출시	aimatters	04.23	12	0
2502	규제∙금리∙전쟁 등 이벤트 예측 AI 스타트업 Sooth Labs, 르쿤·딘 지원 받아 5천만 달러 모금	aimatters	04.23	11	0
2501	메타, 초지능 팀 첫 AI 모델 'Muse Spark' 공개… 왓츠앱·인스타에 순차 적용	aimatters	04.23	14	0
2500	앤트로픽, Pro 요금제에서 클로드 코드 일시 제외 테스트… 개발자 반발에 철회	aimatters	04.23	13	0
2499	오픈AI, 기업용 조인트벤처 '디플로이코'에 최대 15억 달러 투자 추진... 기업용 AI 세일즈 담당해	aimatters	04.23	17	0
2498	비 오는 밤 자율주행 AI의 눈이 뒤집혔다 제미나이 3이 YOLO를 25% 이상 앞섰다	aimatters	04.23	11	0
2497	구글 클라우드 넥스트 2026, 엔비디아 위협하는 에이전트 AI용 8세대 'TPU 8t·8i' 공개 [1]	aimatters	04.23	381	0
2496	"나는 로봇이 아닙니다"가 무너지다, AI가 캡차를 83.9%까지 풀어냈다 [13]	aimatters	04.22	1576	6
2495	AI 챗봇 계정 30만 개가 다크웹에서 팔렸다, IBM이 밝힌 해커들의 AI 활용법	aimatters	04.22	33	0
2494	같은 질문에 GPT는 답하고 클로드는 피했다, 10개 AI 지역 편향 3.8배 격차	aimatters	04.22	35	0
2493	LG전자, 월드IT쇼 2026서 ‘AI 홈·구독·코어테크’ 공개…일상 케어형 솔루션 전면 배치	aimatters	04.22	17	0
2492	美 국방부, 드론에 약 76조 원 쏟아붓는다… 우리나라 국방예산 65조 원 넘는 사상 최대 투자 [4]	aimatters	04.22	1016	3
2491	스페이스X, AI 코딩 스타트업 커서 품는다… 600억 달러 인수 옵션 확보	aimatters	04.22	27	0
2490	AI 투자 1달러가 3달러로 돌아온 20개 기업, 맥킨지가 공개한 12가지 조건	aimatters	04.21	27	0
2489	제미나이 로보틱스 ER 1.6, 로봇이 공장 계기판을 93% 정확도로 읽기 시작했다	aimatters	04.21	24	0
2488	챗GPT가 운전대를 잡으면? 한 대는 겁쟁이 한 대는 폭주족이 됐다	aimatters	04.21	26	0
2487	플로랩스, AI 큐레이션 허브 'AItira' 정식 오픈…"사용자 필요 자동 인식해 AI 도구 추천" [1]	aimatters	04.21	29	0
2486	DJI, NAB Show 2026 참가… RS 5 세계 최초 공개·차량 촬영 솔루션 총출동	aimatters	04.21	21	0
2485	'팀 쿡 시대 끝난다' 팀 쿡, 15년 만에 애플 CEO 퇴임…후임은 하드웨어 수장 존 터너스 [4]	aimatters	04.21	745	0
2484	AI가 쓴 글의 징표 "그것만이 아니라 이것도"… 기업 문서에서 2년 만에 4배 급증	aimatters	04.21	36	0
2483	퍼플렉시티, 맥용 상시 구동 AI 에이전트 '퍼스널 컴퓨터' 출시…오픈클로 대항마 되나	aimatters	04.21	31	0
2482	이제 디자인도 '딸깍?' 앤트로픽, 비디자이너를 위한 시각 창작 도구 '클로드 디자인' 출시	aimatters	04.21	32	0
2481	챗GPT 유료 광고 호주·뉴질랜드·캐나다로 확대… 무료·고 이용자 대상	aimatters	04.21	23	0
2480	오픈AI의 두 가지 실존적 고민… 수익성과 이미지 회복 위기 동시에 직면	aimatters	04.21	22	0

최근 방문

즐겨찾기

즐겨찾기 갤러리

이미지 올리기 이용안내

갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

개념글 리스트

차단하기

[AI 매터스 갤러리]

갤러리 본문 영역

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘