AI 에이전트 개발자 96%, 도구 하나로는 부족..."여러 개 섞어 쓰는 게 대세"

aimatters · 2025.12.04 18:38:29

챗GPT처럼 스스로 판단하고 행동하는 AI를 만드는 개발 도구 시장이 빠르게 커지면서, 개발자들이 한 가지 도구만으로는 원하는 AI를 만들기 어렵다는 사실이 드러났다. 중국 중산대학교 연구팀이 오픈소스 개발 플랫폼 깃허브(GitHub)에 올라온 프로젝트 1,575개와 개발자 토론 8,710건을 분석한 결과, 인기 있는 프로젝트 중 96%가 2개 이상의 개발 도구를 함께 사용하는 것으로 나타났다. 이는 현재 시장에 나온 100개가 넘는 AI 개발 도구 중 어떤 것도 혼자서는 복잡한 작업을 다 처리할 수 없다는 뜻이다.

AI 개발 도구 100개 넘게 쏟아졌지만, 뭘 써야 할지 모르겠다

해당 연구 논문에 따르면, 2022년부터 AI 에이전트 개발 도구는 폭발적으로 늘어났다. AI 에이전트 개발 도구란 대규모 언어모델을 활용해 스스로 생각하고 행동하는 프로그램을 만들 때 필요한 기본 부품들을 모아놓은 것이다. 마치 레고 블록처럼 미리 만들어진 부품을 조립해서 원하는 AI를 더 쉽게 만들 수 있게 해준다. 하지만 도구가 너무 많이 늘어나면서 개발자의 80% 이상이 자기에게 맞는 도구를 찾기 어렵다고 답했다.

연구팀은 주제 태그 분석과 직접 검증을 통해 10개의 주요 도구를 찾아냈다. 랭체인(LangChain), 랭그래프(LangGraph), 오토젠(AutoGen), 크루AI(CrewAI), 메타GPT(MetaGPT), 라마인덱스(LlamaIndex), 스웜(Swarm), 베이비AGI(BabyAGI), 카멜(Camel), 시맨틱커널(Semantic Kernel)이 바로 그것이다. 이 도구들은 하는 일에 따라 4가지로 나뉜다. 기본 작업 관리, 여러 AI 협업, 데이터 처리, 실험용 등이다.

랭체인은 11만 9천 개의 '좋아요'로 가장 인기가 많았고 실제로 105개 프로젝트에서 사용됐다. 반면 메타GPT는 5만 9,200개나 '좋아요'를 받았지만 실제로는 단 2개 프로젝트에서만 쓰였다. 흥미로운 점은 인기와 실제 사용률이 다르다는 것이다. 랭그래프는 9,600개의 '좋아요'만 받았지만 26개 프로젝트에서 사용돼 실제 사용률이 두 번째로 높았다. 연구팀은 개발자들이 도구를 고를 때 깃허브 '좋아요' 같은 단기 인기보다는, 얼마나 오래 관리되고 있는지, 생태계가 얼마나 안정적인지를 먼저 봐야 한다고 강조했다.

랭체인+라마인덱스, 오토젠+랭체인... 섞어 쓰는 게 정석

연구팀이 '좋아요'를 많이 받은 상위 25% 프로젝트를 살펴본 결과, 96%가 2개 이상의 서로 다른 개발 도구를 함께 사용했다. 이는 도구 하나만으로는 실제 작업의 복잡한 요구를 충족할 수 없다는 걸 보여준다.

가장 많이 쓰이는 조합은 두 가지다. 첫째는 작업 관리 도구와 데이터 처리 도구를 함께 쓰는 것이다. 대표적인 예가 랭체인과 라마인덱스다. 랭체인은 여러 작업을 순서대로 처리하는 걸 잘하고, 라마인덱스는 필요한 정보를 빠르게 찾아내는 걸 잘한다. 둘째는 여러 AI 협업 도구와 작업 관리 도구를 함께 쓰는 것이다. 오토젠과 랭체인의 조합이 대표적이다. 랭체인은 거의 모든 주요 AI 언어모델(OpenAI, Anthropic, Hugging Face 등)과 연결할 수 있어서, 오토젠과 함께 쓰면 여러 AI 모델을 바꿔가며 쓸 수 있다.

작업이 안 끝나는 문제 25.6%, 버전 안 맞는 문제 23.5%

연구팀은 소프트웨어 개발 전 과정에서 개발자들이 겪는 어려움을 4가지로 정리했다. 논리 문제, 도구 연결 문제, 성능 문제, 버전 불일치 문제다.

논리 문제는 전체의 3분의 1 이상을 차지한다. 특히 작업이 제대로 끝나지 않는 문제가 25.6%나 된다. 작업을 멈추는 장치가 없어서 AI가 계속 같은 일을 반복한다. 약 8%의 경우 AI가 자기 자신이나 다른 도구를 계속 반복해서 호출하는 '무한 루프'에 빠진다. 이런 문제의 72%는 AI와 외부 도구가 주고받는 과정에서 생긴다. 또한 메시지 관리가 안 돼서 같은 작업을 여러 번 하는 경우가 9.9%다.

도구 연결 문제는 14%를 차지한다. 다른 프로그램과 연결하고 외부 서비스를 사용할 때 연결 속도 제한, 권한 오류, 필요한 프로그램 부품이 없는 것 같은 문제가 생긴다. 근본 원인은 표준화된 연결 방식이 없고 서로 다른 도구끼리 호환이 안 되기 때문이다.

성능 문제는 16.03%를 차지하며, 주로 메모리 관리와 응답 속도가 느린 것에서 생긴다. 대화가 20번 이상 오가면 일부 도구에서 응답이 끊어진다. 여러 작업이 동시에 같은 정보를 찾으려 하면 저장된 데이터가 사라지기도 한다. 정보를 찾아서 답변을 만드는 AI의 평균 처리 시간은 질문당 3.2~5.6초로, 바로 답변만 만드는 방식보다 약 1.8배 느리다.

버전 불일치 문제는 23.5%를 차지한다. AI 시스템은 빠르게 변하는 여러 부품으로 이뤄져 있어서, 한 부품만 업데이트돼도 전체가 고장 나거나 멈출 수 있다. 대표적으로 랭체인이 Pydantic이라는 부품을 버전 1에서 버전 2로 바꾸는 과정에서 대규모 오류가 발생했다.

랭체인·오토젠은 빠른 시제품 제작에 강하지만, 모두 성능은 약해

연구팀은 5가지 기준으로 10개 도구를 비교했다. 배우기 쉬운지, 개발 속도가 빠른지, 기능이 잘 정리돼 있는지, 성능이 좋은지, 유지보수가 쉬운지를 평가했다.

배우기 쉬운 정도에서는 랭체인과 크루AI가 초보자에게 좋다. 랭체인은 설명이 명확하고 200개 이상의 실습 예제를 제공한다. 반면 베이비AGI, 카멜, 스웜 같은 도구들은 배우기 어렵다.

개발 속도 면에서는 오토젠과 랭체인이 빠른 시제품 제작에 강점을 보인다. 개발자 78% 이상이 이 두 도구가 빠른 검증을 가능하게 한다고 답했다. 하지만 랭체인은 구조가 복잡해서 개발자의 42%가 어려움을 느꼈고, 오토젠은 31%의 프로젝트에서 사용자가 만든 도구를 연결할 때 문제가 생겼다.

기능 정리 수준에서는 오토젠과 랭체인이 작업을 잘게 나누고 여러 AI가 협업하는 데 뛰어나다. 하지만 많은 작업이 동시에 일어날 때는 문제가 생긴다.

성능 최적화는 모든 도구의 공통 약점이다. 시맨틱커널, 라마인덱스, 랭체인, 오토젠 모두 데이터를 임시로 저장하는 기능이 부족하거나, 병렬 처리가 약하거나, 메모리를 너무 많이 쓰는 문제가 있다.

유지보수 면에서는 오토젠과 랭체인이 가장 복잡하다. 버전을 업그레이드할 때 기존 코드를 많이 고쳐야 하고, 다른 부품과 충돌이 자주 생긴다.

FAQ ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. AI 에이전트 개발 도구가 뭔가요?

A: 챗GPT 같은 AI를 만들 때 필요한 기본 부품을 모아놓은 소프트웨어입니다. 마치 레고 블록처럼 미리 만들어진 부품을 조립해서 원하는 AI를 더 쉽게 만들 수 있게 도와줍니다.

Q2. 왜 개발자들은 여러 도구를 함께 쓰나요?

A: 도구 하나만으로는 복잡한 작업을 다 처리할 수 없기 때문입니다. 인기 프로젝트의 96%가 2개 이상의 도구를 섞어 씁니다. 랭체인은 작업 관리를 잘하고, 라마인덱스는 정보 검색을 잘해서, 둘을 함께 쓰면 서로 부족한 부분을 채워줍니다.

Q3. AI 개발할 때 가장 큰 어려움이 뭔가요?

A: 작업이 안 끝나고 계속 반복되는 문제(25.6%), 버전이 안 맞는 문제(23.5%), 성능 문제(16%), 도구 연결 문제(14%) 순입니다. 특히 AI가 무한 루프에 빠지는 문제와 도구 버전이 바뀌면서 기존 코드가 안 돌아가는 문제가 큽니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: An Empirical Study of Agent Developer Practices in AI Agent Frameworks

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

인기 기사

번호	제목	글쓴이	작성일	조회	추천
설문	2026년 사주나 운세가 제일 궁금한 스타는?	운영자	25/12/29	-	-
1748	구글, 2026년 첫 AI 안경 출시… 화면 없는 모델·인-렌즈 디스플레이 탑재 [20]	aimatters	25.12.10	1649	3
1747	미국 10대 10명 중 6명 'AI 챗봇 쓴다'... 유튜브·틱톡 넘어 새 일상으로	aimatters	25.12.10	71	0
1746	연봉 격차가 AI 격차로... 퍼플렉시티-하버드, AI 에이전트 사용 연구 결과 공개 [2]	aimatters	25.12.10	1566	0
1745	AI가 코드 짰다고 솔직히 말하면 손해볼까?... 깃허브 1만 4천 건 분석 결과는 '의외' [1]	aimatters	25.12.10	87	0
1744	[12월 10일 AI 뉴스 브리핑] 챗GPT, 2025년 한국에서 가장 많이 성장한 앱 1위 외	aimatters	25.12.10	84	0
1743	한국인 10명 중 7명 "AI 써봤다"… 챗GPT 독주 속 '공짜 AI 시대' 열렸다	aimatters	25.12.09	92	0
1742	"내 사진에 AI로 옷 입혀보고 바로 구매"… 구글 패션 앱 '도플' 업데이트	aimatters	25.12.09	107	0
1741	로봇택시·AI 비서 시대 온다지만... 5년 뒤 AI 세상, 결국 부자만 누린다	aimatters	25.12.09	48	1
1740	68만 유튜버 조코딩, 연봉 4천 받고 수익 나누는 '1인 창업가' 채용 나서	aimatters	25.12.09	99	0
1739	박쥐도 싸울 때 말 많아진다... AI가 밝혀낸 동물 언어의 비밀 [5]	aimatters	25.12.09	678	7
1738	오픈AI, 기업 AI 현황 리포트 공개… “AI 사용량 8배 급증, 업무 시간 하루 최대 1시간 절감”	aimatters	25.12.09	64	0
1737	2024년엔 '우려', 2025년엔 '동반자'... 1년 만에 시민 AI 인식 대반전	aimatters	25.12.09	34	0
1736	[12월 9일 AI 뉴스 브리핑] 엘리스그룹-현대차, 제조 현장 이미지 AI 솔루션 개발 외	aimatters	25.12.09	31	0
1735	구글, '나노 바나나 2 플래시' 출시 임박… 더 저렴한 비용에 프로급 성능	aimatters	25.12.08	306	0
1734	챗GPT, 경제학자·투자자 예측 대결서 160명 중 80등... 효율성은 인간 압도	aimatters	25.12.08	85	0
1733	일론 머스크·저크버그 얼굴 달린 로봇 개 영상 화제… 1.5억 가격에도 전 작품 완판 [5]	aimatters	25.12.08	1485	1
1732	[신간] 건강 관리, 취업 준비, 사업 준비까지… AI 일상 활용법 담은 『시켜보니 다 되는 생활밀착형 AI』	aimatters	25.12.08	52	0
1731	"40년 숙제 풀었다"… AI 만난 로봇 손, 드디어 인간처럼 물건 만진다	aimatters	25.12.08	105	0
1730	GPT-5보다 정확하고 2.5배 싸다... 엔비디아, '지휘자 AI' 전략 공개 [5]	aimatters	25.12.08	2728	5
1729	AI가 경제 활동하면 생기는 일… “배달 시켰더니 돈 다 써서 스쿠터만 사고 안 써”	aimatters	25.12.08	68	0
1728	[12월 8일 AI 뉴스 브리핑] 서울AI재단, AI를 '동반자'로 인식하는 시민 37.2% 달해 외	aimatters	25.12.08	44	0
1727	‘~가 뭐야?’ 구글, 2025년 검색 트렌드 발표... “대화형 질문 사상 최대치”	aimatters	25.12.05	56	0
1726	AI 챗봇, 정치 광고보다 4배 효과적... 설득력 높을수록 거짓 정보 증가	aimatters	25.12.05	56	0
1725	앤트로픽 CEO "일부 AI 기업은 욜로 중"… 오픈AI 저격하나	aimatters	25.12.05	57	0
1724	한국, 2026년 AI 기본법으로 '규제 업그레이드'… OECD, 아시아 금융 AI 정책 분석 보고서 공개	aimatters	25.12.05	49	0
1723	“검사 안 해도 돼요” AI 의사 말 믿었다간... 심각한 오류 4건 중 3건이 '진단 누락'	aimatters	25.12.05	99	0
1722	[12월 5일 AI 뉴스 브리핑] 홈쇼핑모아, 2025 올해의 브랜드… 로보락·AHC 등 선정 외	aimatters	25.12.05	126	0
1721	한국 AI 인력 5.7만 명 시대... 한국은행 "고학력·고임금에도 해외 유출 심각"	aimatters	25.12.05	96	0
1720	AWS, 클릭 몇 번으로 맞춤형 AI 모델 만든다... 신규 기능 대거 발표	aimatters	25.12.04	55	0
1719	아마존, AWS 리인벤트 2025서 차세대 AI 칩 ‘트레이니엄3’ 공개	aimatters	25.12.04	59	0
1718	챗GPT, 한국 사용자 2천만 돌파… 한국인 AI 앱 사용 순위 Top 10 공개	aimatters	25.12.04	271	0
1717	챗GPT가 거짓말하면 스스로 자백하게 만든다... 오픈AI, ‘고백’ 시스템 공개 [15]	aimatters	25.12.04	2880	4
	AI 에이전트 개발자 96%, 도구 하나로는 부족..."여러 개 섞어 쓰는 게 대세"	aimatters	25.12.04	110	0
1715	NYU 연구진 "병원들이 돈 주고 쓰는 의료 전문 AI, 챗GPT보다 못하다"	aimatters	25.12.04	138	0
1714	[12월 4일 AI 뉴스 브리핑] 트레져러, AI 투자분석 '알파렌즈'로 ‘AI x 소프트웨이브 2025’ 참가 외	aimatters	25.12.04	103	0
1713	런웨이, 차세대 AI 영상 생성 모델 Gen-4.5 공개… 엔비디아와 협업	aimatters	25.12.02	84	0
1712	“영상계의 나노바나나 프로 나왔다”… 클링, 멀티모달 비디오 생성 모델 ‘Kling O1’ 공개 [6]	aimatters	25.12.02	3296	5
1711	엔비디아, 세계 최초 오픈소스 추론 자율주행 모델 공개… "사람처럼 생각하는 자율차"	aimatters	25.12.02	66	0
1710	AI가 쓴 인도 이야기 10편 중 9편이 '가짜 문화'... 음식·의상·축제 모두 틀렸다 [16]	aimatters	25.12.02	1944	4
1709	‘의사’ 역할 맡은 AI, 97%가 자신이 AI인 걸 숨긴다... 금융 상담 땐 정반대 [12]	aimatters	25.12.02	2340	2
1708	[12월 2일 AI 뉴스 브리핑] 세이지, 정부 지원으로 중소사업장에 지능형 CCTV 보급 외	aimatters	25.12.02	47	0
1707	챗GPT가 우리 브랜드 제품 추천하게 만드는 방법	aimatters	25.12.02	149	0
1706	제미나이3 충격파? 오픈AI '코드 레드' 선포... 광고 계획은 뒤로	aimatters	25.12.02	161	0
1705	'아바타' 제임스 카메론 감독 "생성형 AI는 끔찍하다" [24]	aimatters	25.12.01	1421	6
1704	2025년 대표하는 기술 1위는 ‘데이터센터’… NYT "챗GPT는 3위”	aimatters	25.12.01	52	0
1703	[12월 1일 AI 뉴스 브리핑] 리빌더AI, 일본 아식스 등 글로벌 VC로부터 85억 원 투자 유치 외	aimatters	25.12.01	98	0
1702	LLM의 고질병 ‘첫 단어 집착증’ 개선... 알리바바, '뉴립스' 최고 논문상 수상	aimatters	25.12.01	82	0
1701	AI가 쓴 시가 시인이 쓴 시보다 높은 점수... 'AI 작품'이라 알려주니 평가 급락	aimatters	25.12.01	89	0
1700	"정확도 90%?" 도박 중독 막는다던 AI, 실제로는 제대로 작동하는지 아무도 몰라	aimatters	25.12.01	58	0
1699	챗GPT 등장 전으로 인터넷 되돌리는 확장 프로그램 등장 [29]	aimatters	25.11.28	3708	13

최근 방문

즐겨찾기

즐겨찾기 갤러리

이미지 올리기 이용안내

갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

개념글 리스트

차단하기

[AI 매터스 갤러리]

갤러리 본문 영역

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘