디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

GPT-5보다 정확하고 2.5배 싸다... 엔비디아, '지휘자 AI' 전략 공개

aimatters갤로그로 이동합니다. 2025.12.08 17:13:38
조회 2768 추천 5 댓글 5


엔비디아(NVIDIA)가 작은 AI 모델로 GPT-5보다 더 나은 성능을 내는 새로운 방법을 공개했다. '툴오케스트라(ToolOrchestra)'라는 이름의 이 기술로 만든 AI는 크기가 GPT-5보다 훨씬 작지만, 어려운 문제를 푸는 정답률에서 GPT-5를 앞질렀고 비용은 2.5배나 저렴했다. 이 AI의 비결은 혼자 모든 걸 해결하려 하지 않고, 상황에 맞는 전문가 AI들에게 일을 나눠주는 '지휘자' 역할을 한다는 점이다. AI 업계에서 '크면 클수록 좋다'는 통념을 뒤집는 결과로 주목받고 있다.



혼자 다 하지 않고, 전문가에게 맡긴다... AI계의 '지휘자' 등장

해당 논문에 따르면, 툴오케스트라는 기존 AI와 완전히 다른 방식으로 작동한다. 지금까지 대부분의 AI는 하나의 거대한 모델이 검색이나 계산 같은 보조 기능의 도움을 받아 모든 문제를 직접 해결했다. 하지만 툴오케스트라는 작은 '지휘자 AI'를 중심에 두고, 여러 전문가 AI들을 상황에 맞게 불러 쓴다.

엔비디아 연구팀은 사람이 어려운 문제를 풀 때 자기 지식만 쓰지 않고 전문가나 전문 프로그램의 도움을 받는다는 점에 주목했다. 예를 들어 복잡한 세무 문제가 생기면 세무사에게 물어보고, 법률 문제는 변호사에게 맡기는 식이다. 이런 아이디어를 AI에 적용한 것이 툴오케스트라다. 이 방식에서는 여러 AI가 협력해서 만들어내는 '팀워크'가 핵심이다.

지휘자 AI가 부릴 수 있는 '전문가'의 범위도 넓다. 수학 문제에 특화된 AI인 Qwen2.5-Math-72B, 프로그래밍에 강한 Qwen2.5-Coder-32B, 그리고 GPT-5나 Claude Opus 4.1 같은 범용 AI까지 다양하다. 지휘자 AI는 문제마다 어떤 전문가를 쓸지, 비용과 성능을 따져가며 실시간으로 결정한다.





정답률 37.1% vs GPT-5 35.1%... 비용은 30%만 썼다

엔비디아의 지휘자 AI 성능은 여러 시험에서 입증됐다. '인류 최후의 시험(HLE)'이라는 이름의 테스트는 박사급 난이도로, 수학부터 인문학, 자연과학까지 다양한 분야의 초고난도 문제들로 구성돼 있다. 여기서 엔비디아 AI는 37.1%의 정답률을 기록했다. 이는 GPT-5의 35.1%와 Claude Opus 4.1의 34.6%보다 높은 수치다.

더 놀라운 건 비용과 처리 시간이다. 엔비디아 AI는 평균 문제당 9.2센트의 비용과 8.2분의 시간이 걸렸다. 반면 GPT-5는 30.2센트와 19.8분, Claude Opus 4.1은 52.5센트와 25.6분이 필요했다. 엔비디아 AI가 GPT-5의 30%만 쓰고도 더 좋은 성능을 냈다는 의미다. 다른 시험에서도 비슷한 결과가 나왔다. 정보 검색과 추론을 테스트하는 'FRAMES'에서는 76.3%로 GPT-5(74.0%)를 넘어섰고, 대화하며 문제를 푸는 능력을 보는 'τ²-Bench'에서는 80.2%로 GPT-5(77.7%)보다 높았다. 특히 τ²-Bench에서 엔비디아 AI는 전체 단계 중 40%만 비싼 GPT-5를 쓰고 나머지는 저렴한 AI나 도구를 활용했는데도, 매번 GPT-5를 쓰는 방식보다 성적이 좋았다.

추천 비추천

5

고정닉 0

2

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 치어리딩 가장 잘할 것 같은 스타는? 운영자 26/05/11 - -
2721 “그림판인 줄 알았는데 AI였다”…챗GPT 이미지 2.0, 그림판 그림 열풍 이끌었다
aimatters갤로그로 이동합니다.
05.13 28 0
2720 극단적 위협 아닌 '막다른 길'이 규칙 위반을 부른다... AI 1,680회 실험에서 드러난 진실 [4]
aimatters갤로그로 이동합니다.
05.13 1038 6
2719 솔트웨어, 31억 규모 반도체 제조 AI 사업 수주… AI 데이터 플랫폼 기업으로 전환 가속
aimatters갤로그로 이동합니다.
05.13 13 0
2718 마키나락스, IPO 일반청약 경쟁률 2,807.8대 1… 13.9조 원으로 2026년 최고 청약 증거금 기록 경신
aimatters갤로그로 이동합니다.
05.13 18 0
2717 최신 AI 붐 아이디어 '집에 미니 데이터센터 들여라'…SPAN·엔비디아·풀테그룹 'XFRA' 공식 가동
aimatters갤로그로 이동합니다.
05.13 584 2
2716 MS 365 코파일럿에 '캘린더 에이전트' 본격 가동…SharePoint도 자연어로 차트 만든다
aimatters갤로그로 이동합니다.
05.13 18 0
2715 메타, Llama 버리고 'Muse Spark'로 갈아탔다…AI 앱 신기능 본격 전개
aimatters갤로그로 이동합니다.
05.13 24 0
2714 소프트뱅크, '엔비디아 대항마' 영국 그래프코어에 4억5천만 달러 추가 투입…AGI 정조준
aimatters갤로그로 이동합니다.
05.13 22 0
2713 법정 선 샘 알트만 "머스크가 OpenAI를 자기 아이들에게 물려주겠다더라" [4]
aimatters갤로그로 이동합니다.
05.13 792 2
2712 구글, AI 노트북 '구글북' 공식 발표…매직 포인터로 'PC의 정의'를 다시 쓴다
aimatters갤로그로 이동합니다.
05.13 70 0
2711 톰슨로이터 CoCounsel, 클로드 위에서 다시 태어났다…Agent SDK로 전면 재설계
aimatters갤로그로 이동합니다.
05.13 10 0
2710 법률 시장 정조준한 앤트로픽, 'Claude for Legal' 공개…12개 변호사 전용 플러그인 동시 출시
aimatters갤로그로 이동합니다.
05.13 19 0
2709 앤트로픽-AWS 동맹 가속화…클라우드 빅3 최초 '클로드 플랫폼' AWS 안에서 정식 출시
aimatters갤로그로 이동합니다.
05.13 21 0
2708 사진 설명을 텍스트 한 줄로 바꾸는 순간 AI 에이전트 인식 정확도가 7.7%로 추락한다
aimatters갤로그로 이동합니다.
05.13 19 0
2707 깃랩(GitLab), ‘에이전틱 시대’ 베팅에 인력 감축… 운영 국가 수 30% 축소·R&D 60팀 재편
aimatters갤로그로 이동합니다.
05.12 38 0
2706 ‘우주 데이터센터’ 띄울 로켓이 모자란다… 카우보이 스페이스, 약 4,100억 원 시리즈 B 조달
aimatters갤로그로 이동합니다.
05.12 17 0
2705 엘리스그룹, 고용노동부 ‘K-디지털 트레이닝 AI 캠퍼스’ 운영기관 선정… 실전형 AI 엔지니어 양성
aimatters갤로그로 이동합니다.
05.12 12 0
2704 ‘쿨리닉’, 피지컬 AI 기반 스마트 냉동장비 체계 구축… 콜드체인 사후 관리 한계 깬다
aimatters갤로그로 이동합니다.
05.12 14 0
2703 동영상도 자동으로 얼굴 블러...아이엠지베이스 VDIT, ‘AI 얼굴 자동 모자이크’ 탑재
aimatters갤로그로 이동합니다.
05.12 13 0
2702 데이블, 대화형 AI 뉴스 위젯 ‘에이블(AI-ble)’ 출시… 기사 안에서 독자 질문 직접 응답
aimatters갤로그로 이동합니다.
05.12 12 0
2701 다시 살아난 ‘디그(Digg)’… 이번엔 AI 뉴스 어그리게이터로 회귀
aimatters갤로그로 이동합니다.
05.12 11 0
2700 스위스 ‘픽테’ 35억 달러 펀드, 현금 비중 30% 아시아·미국 AI 주식으로 옮겼다
aimatters갤로그로 이동합니다.
05.12 18 0
2699 브린욜프슨 “AI 일자리 충격 대비 부족하다”… 美 노동생산성 연 1.8% 성장 베팅
aimatters갤로그로 이동합니다.
05.12 36 0
2698 아시아 증시, AI 낙관론에 중동 불안 압도… 한국 코스피 5% 폭등 사상 최고
aimatters갤로그로 이동합니다.
05.12 15 0
2697 맥 미니가 ‘AI 에이전트 호스트’로… 클로드 수요에 애플 인상·품귀 사태
aimatters갤로그로 이동합니다.
05.12 15 0
2696 알파벳, 첫 엔화 채권 발행 추진… AI 인프라 260조 원 캐펙스 자금 조달 목표
aimatters갤로그로 이동합니다.
05.12 14 0
2695 한국 대기업이 베팅한 컨피그(Config), 370억 원 시드… ‘로봇 데이터의 TSMC’ 노린다
aimatters갤로그로 이동합니다.
05.12 65 0
2694 IBM 보고서 “글로벌 기업 76%가 CAIO 신설”… 1년 만에 26%→76% 폭증
aimatters갤로그로 이동합니다.
05.12 43 0
2693 마이크로소프트, 오픈AI 초기 투자에서 126조 원 회수 목표… ‘AI 시대 최대 베팅’ 평가
aimatters갤로그로 이동합니다.
05.12 11 0
2692 오픈AI, 40억 달러 규모 ‘디플로이먼트 컴퍼니’ 출범… 직원 파견으로 기업 AI 도입 가속
aimatters갤로그로 이동합니다.
05.12 15 0
2691 AI 에이전트 성능 한계 구현법은 추론이 아니라 '눈'이었다, 클로드 오퍼스 4.6 제친 GLM-5V-Turbo의 비밀
aimatters갤로그로 이동합니다.
05.12 14 0
2690 정확도 95%로 알츠하이머 잡아낸 AI 에이전트, '이것' 모르면 0점?
aimatters갤로그로 이동합니다.
05.12 13 0
2689 [AI 옵저버] 너희가 가둬뒀던 클로드 미토스가, 이번 주 너희를 구했다
aimatters갤로그로 이동합니다.
05.11 53 0
2688 카메라 들이대고 "이거 얼마야?" 물으면 폰이 알아서 타오바오를 연다, 오포(OPPO)가 공개한 엣지 AI 에이전트 [9]
aimatters갤로그로 이동합니다.
05.11 1383 1
2687 AI 혁명의 진짜 병목은 모델 아닌 '전력·반도체·인재'… 한국 정책에 던지는 3대 숙제 [5]
aimatters갤로그로 이동합니다.
05.11 627 1
2686 빅테크 990조 원 AI 인프라 베팅… 잉여현금 급감, 한국 HBM 사이클도 직격
aimatters갤로그로 이동합니다.
05.11 34 0
2685 김민석 총리, 'UN AI 허브' 한국 유치 TF 출범… 일본·싱가포르와 경쟁 본격화
aimatters갤로그로 이동합니다.
05.11 31 0
2684 익스피리언 "2026년 데이터 유출 1위는 에이전틱 AI" 기계끼리 유출할 경우 책임 소재 모호
aimatters갤로그로 이동합니다.
05.11 19 0
2683 "우버, 단순 차량 호출 이상이 되려는 이유"… 종합 자동차 로보틱스 회사로 발돋움
aimatters갤로그로 이동합니다.
05.11 310 1
2682 테크크런치 "xAI-앤트로픽 컴퓨팅 거래에 냉소적"… 머스크 클라우드 회사로 전환하나
aimatters갤로그로 이동합니다.
05.11 80 0
2681 AI 에이전트가 도구를 잘못 불러놓고 아닌 척 하고 있다… '툴 포이즈닝' 보안 취약점 공식 제기
aimatters갤로그로 이동합니다.
05.11 38 0
2680 CNN "AI는 당신 일자리를 빼앗지 않는다… 직무의 모양을 바꿀 뿐"
aimatters갤로그로 이동합니다.
05.11 27 0
2679 마이크로소프트, 케냐 AI 데이터센터 사실상 좌초… 정부 지급보증 협상 결렬
aimatters갤로그로 이동합니다.
05.11 21 0
2678 앤트로픽 "인터넷 글들의 악마적 AI 묘사를 학습한 클로드가 엔지니어를 협박하게 만들었다"
aimatters갤로그로 이동합니다.
05.11 27 0
2677 2030년이면 운영 결정 절반을 AI가 내린다, 그런데 지금 직원의 25%만 AI를 쓰고 있다
aimatters갤로그로 이동합니다.
05.11 21 0
2676 구글 계정 하나로 PPT·웹페이지·팟캐스트 뚝딱…제미나이 무료버전의 진짜 위력
aimatters갤로그로 이동합니다.
05.08 54 0
2675 [에이-아이랑] 매일이 어린이날 같기를 - AI 시대의 또 다른 놀이터
aimatters갤로그로 이동합니다.
05.08 25 1
2674 에이서, 지마켓 '빅스마일데이'서 게이밍·AI 노트북 최대 36% 할인
aimatters갤로그로 이동합니다.
05.08 37 0
2673 AMD, 기존 데이터센터 그대로 쓰는 엔터프라이즈 AI GPU '인스팅트 MI350P PCIe' 출시
aimatters갤로그로 이동합니다.
05.08 103 0
2672 픽스AI, 자연어로 캐릭터·텍스트·배경 수정하는 AI 이미지 편집 모델 'Edit Pro' 공개
aimatters갤로그로 이동합니다.
05.08 23 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2