디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[🏆베스트] Gemini 3.0 Pro 모델 카드 총정리 : Sparse MoE TF앱에서 작성

ㅇㅇ­갤로그로 이동합니다. 2025.11.18 20:52:32
조회 11720 추천 26 댓글 18


구글 딥마인드, ‘제미니 3 프로’ 100만 토큰 맥락·고급 에이전트 성능 강조

구글 딥마인드가 2025년 11월, 제미니 시리즈의 최신 모델인 ‘제미니 3 프로(Gemini 3 Pro)’ 모델 카드를 공개했다. 이번 모델은 텍스트·이미지·오디오·영상·코드까지 아우르는 네이티브 멀티모달 구조와 대규모 추론 능력을 앞세워, 기존 ‘제미니 2.5 프로’를 전면 교체하는 플래그십으로 자리매김시켰다는 평가다.  


차세대 구조: 스파스 MoE 기반 멀티모달 트랜스포머

제미니 3 프로는 기존 모델의 파인튜닝 버전이 아닌, 처음부터 새로 설계된 스파스 Mixture-of-Experts(MoE) 트랜스포머 아키텍처를 채택했다. 입력으로 텍스트, 이미지, 오디오, 동영상, 코드 전체 리포지토리를 처리하며, 최대 100만 토큰(context window)까지 수용할 수 있고 출력은 최대 6.4만 토큰까지 생성 가능하다.  

스파스 MoE 구조를 통해 각 토큰마다 일부 전문가 파라미터만 활성화하는 방식으로, 총 용량과 추론 비용을 분리해 “용량은 크되, 토큰당 계산비용은 억제”하는 방향을 취한 것이 특징이다. 이는 긴 맥락 처리와 복잡한 멀티스텝 추론에서 특히 유리한 설계로 평가된다.  


학습 데이터: 웹·코드·멀티모달·사용자·합성 데이터까지 총동원

모델 카드에 따르면, 제미니 3 프로는 대규모 웹 문서, 다양한 프로그래밍 언어의 코드, 이미지·오디오·비디오 등 멀티모달 데이터를 포괄하는 방대한 데이터셋으로 사전 학습됐다. 이후 멀티모달 지시-응답 쌍, 인간 선호 데이터, 도구 사용 데이터 등을 활용한 지시 튜닝과 강화학습(다단계 추론·문제 해결·정리/증명 데이터 포함)을 거쳤다.  

데이터 출처에는
공개 웹과 공개 데이터셋,
상업적 라이선스로 확보한 데이터,
구글 서비스 이용자의 데이터(약관·프라이버시 정책·사용자 통제에 따름),
내부 업무·워크포스에서 생성한 데이터,
AI가 생성한 합성 데이터
등이 포함된다.  

수집된 데이터는 중복 제거, robots.txt 준수, 음란·폭력·아동 성착취물 등 유해 콘텐츠 필터링, 품질 필터링 등 다단계 전처리를 거쳐 훈련에 투입됐다.  


TPU 기반 대규모 학습… 지속 가능성도 강조

제미니 3 프로는 구글 TPU(Tensor Processing Unit) 팟에서 JAX·Pathways 스택을 활용해 학습됐다. TPU는 고대역폭 메모리와 대규모 분산 학습이 가능한 전용 하드웨어로, 대형 모델의 학습 속도와 효율을 크게 끌어올릴 수 있다는 점이 강조된다. 구글은 이를 자사 지속 가능성 전략과도 연결지어, TPU 효율 향상이 에너지·탄소 측면에서도 이점을 제공한다고 설명했다.  


배포 채널: 앱부터 클라우드까지 전 제품군에 탑재

제미니 3 프로는
Gemini 앱,
Google Cloud Vertex AI,
Google AI Studio 및 Gemini API,
Google AI Mode,
Google Antigravity
등 다양한 채널을 통해 제공된다. 개발자와 기업은 API를 통해 모델에 접근하며, 각 채널별 추가 약관(예: Gemini API 추가 약관, Google Cloud TOS)의 적용을 받는다.  


벤치마크 성능: 고난도 수학·코딩·에이전트 작업에서 2.5 Pro 압도

모델 카드는 제미니 3 프로가 2.5 프로 대비 다양한 벤치마크에서 의미 있는 우위를 보인다고 밝힌다. 대표적으로 모델 카드 5페이지의 성능 표에 따르면,  
Humanity’s Last Exam(학술 추론, 도구 없음): 37.5%로 2.5 Pro(21.6%) 대비 큰 폭 상승
ARC-AGI-2(고난도 추론 퍼즐): 31.1%로 2.5 Pro(4.9%)와 큰 격차
GPOA Diamond(과학지식): 91.9%로 2.5 Pro(86.4%) 상회
AIME 2025(도구 없는 수학 경시): 25.0% 정답률, 코드 실행을 허용하면 100%까지 도달
MATHarena Apex, MMMU-Pro, Video-MMMU 등 수학·학문·비디오 이해 벤치마크에서도 전반적으로 2.5 Pro보다 높은 점수

또한 LiveCodeBench Pro, SWE-Bench Verified, t2-bench 등 에이전트 코드 작성·도구 사용·테스트 통과 능력을 평가하는 벤치마크에서도 제미니 3 프로가 2.5 Pro와 타 모델(Claude Sonnet 4.5, GPT-5.1) 대비 경쟁력 있는 수치를 기록한 것으로 나타난다.

종합적으로 보면, 제미니 3 프로는
에이전트형 도구 사용,
장문 컨텍스트 추론,
수학·코딩·멀티모달 이해
영역에서 전 세대 대비 눈에 띄는 상향을 보여 “복잡한 실제 업무용”을 겨냥한 모델이라는 점을 부각한다.  


활용 분야: “복잡한 현실 문제를 단계적으로 해결하는 에이전트”

구글은 제미니 3 프로를 “가장 지능적이고 적응적인 모델”로 규정하며, 다음과 같은 활용 시나리오를 제시한다.  
에이전트형 작업(도구 호출, 멀티스텝 계획 수립, 워크플로 자동화)
고급 코딩(코드 리포지토리 단위 이해·변환·리팩토링)
100만 토큰급 장문 문서·코드·로그 분석
텍스트·이미지·오디오·비디오를 동시에 다루는 멀티모달 분석
알고리즘 설계 및 이론적 문제 해결

다만 모델 지식은 2025년 1월까지의 정보에 기반하고 있어, 그 이후의 최신 사실·이벤트에 대해서는 한계가 있다.  


한계와 위험: 환각·응답 지연·멀티턴 품질 저하 가능성

모델 카드는 제미니 3 프로가 여전히 일반적인 기저모델의 한계—허위 정보(‘환각’) 생성 가능성, 응답 지연·타임아웃—를 갖고 있음을 명시한다.  

또한 안전 섹션에서는 주요 잔여 리스크로
프롬프트 공격·탈옥(jailbreak)에 대한 취약성(2.5 Pro보다 개선되었으나, 여전히 연구 과제),
멀티턴 대화에서의 품질 저하·안정성 문제
를 꼽는다.  


안전·윤리: 자동·수동 레드팀, 다국어 안전 평가, “불필요한 거절 줄이기”

제미니 3 프로는 개발 과정에서
훈련 중·후에 반복되는 자동·인간 평가,
모델 팀 외부 전문팀에 의한 인간 레드팀,
대규모 자동 레드팀,
윤리·안전 리뷰,
Google DeepMind의 Frontier Safety Framework에 따른 테스트
를 거쳤다.  

특히 안전 정책은
1. 아동 성착취·학대물,
2. 증오 발언,
3. 자해·폭력·범죄 등 위험한 콘텐츠,
4. 괴롭힘,
5. 노골적 성적 콘텐츠,
6. 과학·의학적 합의에 반하는 의료 조언
생성을 차단하는 것을 목표로 한다.  

내부 자동 안전 평가 결과(개발 단계 기준)에서는, 2.5 Pro 대비
텍스트→텍스트 안전성 점수는 약간 감소(-10.4%)했지만,
다국어 안전(+0.2%), 이미지→텍스트 안전(+3.1%),
거절 시 톤 개선(+7.9%),
정당하지 않은 거절(Unjustified refusals) 감소(+3.7%)
등을 통해 “필요 이상으로 거절하지 않으면서도 안전성을 유지·개선”하려는 방향이 드러난다.  

전문 레드팀 결과, 아동 안전 기준과 전반적인 콘텐츠 안전 기준에서 2.5 Pro 대비 “동일하거나 개선된” 수준의 성능을 보였고, 심각한 우려 요인은 발견되지 않았다고 모델 카드는 밝힌다.  


프런티어 안전 평가: “임계 능력 수준에 도달하지는 않았다”

모델 카드 마지막 부분에는 Frontier Safety Framework에 따른 ‘임계 능력 수준(Capability Critical Level, CCL)’ 평가 결과가 정리되어 있다(9페이지 표).  
CBRN(화학·생물·방사능·핵): 낮은~중간 수준 위협 행위자에게 유의미한 수준의 새로운·완결된 지침을 제공하지는 못해, CCL 미달
사이버보안: v1 난이도 문제 11/12 해결, v2 문제는 0/13 해결. 경보 기준에는 미치지 못해 CCL 미달
해로운 조작(Harmful Manipulation): 비-AI 기준선 대비 조작 능력은 향상되었으나 이전 모델 대비 추가 상승은 크지 않아 CCL 미달
기계학습 R&D 가속: 특정 연구 벤치마크에서 2.5 계열을 앞섰지만, 총점은 여전히 CCL 경보 기준 이하
비정렬성(오용·은닉 행동) 탐지: 제한된 상황 인식·은닉 시나리오에서만 성공, CCL 미달

즉, 제미니 3 프로는 강력한 범용 능력을 갖추었지만, 구글 내부 기준상 “프런티어 위험을 즉각 고조시키는 수준의 특수 능력”에는 도달하지 않았다는 것이 공식 평가다.  


종합 분석: “실전형 멀티모달 에이전트”를 지향하는 플래그십

모델 카드 내용과 수치를 종합하면, 제미니 3 프로의 특징은 다음 세 가지로 요약된다.
1. 실사용·업무 환경을 겨냥한 에이전트형 모델
100만 토큰 컨텍스트, 코드 리포지토리 단위 이해, 다양한 에이전트·코딩 벤치마크에서의 개선 등은 단순 질의응답을 넘어 “복잡한 프로젝트를 단계별로 풀어가는 실전형 모델”을 지향하고 있음을 보여준다.
2. 데이터·안전 체인을 통한 상용 서비스 통합 최적화
웹·코드·합성·사용자 데이터를 아우르는 학습 파이프라인과, 다층 안전 필터·레드팀·정책 체계를 결합해, 구글 생태계(Gemini 앱, 클라우드, API 등) 전반에 바로 탑재할 수 있는 “상용 서비스용 베이스모델”로 설계된 점이 두드러진다.
3. 프런티어 리스크 관리 하에서의 성능 상향
프런티어 안전 프레임워크 평가에서 CCL을 넘지 않는 선에서, 고난도 수학·코딩·추론 성능을 끌어올리려 한 흔적이 모델 카드 곳곳에 드러난다. 이는 “위험 역량의 급격한 비약 없이, 범용 지능 레벨을 점진적으로 상향”하는 전략으로 해석할 수 있다.  

결론적으로, 제미니 3 프로는 제미니 2.5 프로를 대체하는 구글의 주력 멀티모달 LLM로, 긴 맥락·에이전트·코딩·멀티모달 작업에 특화된 상용 모델이다. 환각·탈옥·멀티턴 안정성 등 고질적 과제는 여전히 남아 있지만, 모델 카드만 놓고 보면 “실제 제품과 업무 자동화에 바로 투입될 수 있는 차세대 기반 모델”로 포지셔닝되고 있다.

78e88500b1f66a87239df5e1309c706c88aca64c0a1d404957c41c4506b50cb51364db8416ddcf8130e830123c9e898ca57a05e3
자동등록방지

추천 비추천

26

고정닉 19

댓글 영역

전체 댓글 0
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
- 설문 내 며느리, 사위로 만나면 부담스러울 것 같은 스타는? 운영자 26/03/09 - -
988250 공지 특갤 통합 공지 / 신고 및 문의 [9] ㅇㅇ갤로그로 이동합니다. 26.02.22 32220 44
353422 공지 완몰가가 궁금한 사람들은 필독 (계속 추가 예정) [26] 부패하는유전자!!!갤로그로 이동합니다. 23.09.03 29670 75
572295 공지 특갤 용어 모음집 [7] ㅇㅇ갤로그로 이동합니다. 24.11.24 13887 8
1045755 공지 특갤봇v2 신문고입니다. [185] だいき갤로그로 이동합니다. 26.03.10 14054 23
1053505 일반 여러분 돈 다이합시다 진짜 ㅇㅇ갤로그로 이동합니다. 18:23 14 0
1053504 일반 자랑 하러왔다 [3] ㅇㅇ갤로그로 이동합니다. 18:23 23 0
1053503 일반 소넷 이새키 머냐 ㅋㅋ [1] ㅇㅇ(221.153) 18:22 45 0
1053502 일반 pro 쓰는 특붕이들 잠깐 일루와보셈 [3] ㅇㅇ갤로그로 이동합니다. 18:22 22 0
1053501 일반 바코보다 바코워크플로우 깎기가 더 재밋노 IceTea갤로그로 이동합니다. 18:22 8 0
1053500 일반 잼민이랑 클로드가 성향 진짜 극단적인듯 ㅇㅇ(211.216) 18:22 22 0
1053499 일반 GPT-5.4에 대한 공통적인 증언 [1] EXERCENS갤로그로 이동합니다. 18:21 63 2
1053498 일반 걍 특붕이들 << 이거임 ㅋㅋ; 바다기린갤로그로 이동합니다. 18:21 40 0
1053497 일반 요샌 특이점 관심없고 모르는 사람이 승리자 같음 [6] ㅇㅇ(58.78) 18:20 100 2
1053496 일반 3개월만에 내가 좋아하는 피자 먹었어.. [3] ㅇㅇ갤로그로 이동합니다. 18:19 46 0
1053495 일반 오늘이 무슨 날인지 아냐? [3] ㅇㅇ(122.36) 18:19 55 0
1053494 일반 구글이 한도 줄여도 화난척만 하는 쌀먹단이면 개추 [5] ㅇㅇ(210.217) 18:19 62 1
1053493 일반 중요한건 지금 코덱스 할당량2배란거임 라비갤로그로 이동합니다. 18:19 27 0
1053492 일반 솔직히 자랑이든 뭐든 조금의 아이디어나 정보만 있으면 되는거 아냐? [3] ㅇㅇ갤로그로 이동합니다. 18:18 61 0
1053491 일반 챗지피티 프로 구독하고 좀 현타옴 [6] 큼쪽갤로그로 이동합니다. 18:17 132 0
1053490 일반 버거 정도면 할만한데 싶다가도 [8] 제미나이사용자갤로그로 이동합니다. 18:17 92 0
1053489 일반 아이러니하게도 지금 ai로 수익실현 하는 사람들은 선형임 [2] ㅇㅇ(121.167) 18:17 104 0
1053488 일반 클코 띵킹 effort 뭐로 설정함? ㅇㅇ갤로그로 이동합니다. 18:16 21 0
1053487 일반 코덱스에서 토큰 아끼려면 컴팩트되기 전에 새 세션으로 작업하는 게 낳음? [2] ㅇㅊㅇ갤로그로 이동합니다. 18:16 39 0
1053486 일반 몇몇 따거들은 자랑해도 뿌리면서 자랑하던데 ㅇㅇ(14.39) 18:15 47 0
1053485 일반 제미니 코딩이 장점은 있음 [2] fewaw갤로그로 이동합니다. 18:15 55 0
1053484 일반 특갤에서 비틱하는 사람들 화나게 하는 방법 [2] ㅇㅇ갤로그로 이동합니다. 18:15 78 0
1053483 일반 자랑합니다............... [5] 서벌먕먕이갤로그로 이동합니다. 18:14 146 1
1053482 일반 하 씨발 특이점 11년전부터 믿고 빨았는데 [8] ㅇㅇ갤로그로 이동합니다. 18:14 182 2
1053481 일반 퍼플렉시티 원래 이런거임? ㅇㅇ(211.203) 18:13 36 0
1053480 일반 그록 헤비 구독한 사람 있냐 [2] ㅇㅇ(210.217) 18:13 49 0
1053479 일반 자본주의의 위기에서 "그게 돈이 되나요?" 같은 소리만 하고 있다니 [1] ㅇㅇ갤로그로 이동합니다. 18:13 104 1
1053478 일반 자랑 << 아직 살아잇음 [5] ㅁㄱㅌㅊ갤로그로 이동합니다. 18:12 97 1
1053477 일반 선버거 뿌리고 나중에 자랑해도 됨?? [8] ㅇㅇ갤로그로 이동합니다. 18:11 93 0
1053476 일반 특갤 자랑글 특징..real [1] ㅇㅇ갤로그로 이동합니다. 18:11 122 0
1053475 일반 나는 파파존스 [12] 과자에오갤로그로 이동합니다. 18:10 118 0
1053474 일반 나도 진짜진짜 4월부터는 수익 낸다 [9] 봄바다갤로그로 이동합니다. 18:10 186 0
1053473 일반 2029년까지 3년 남았다 [1] ㅇㅇ(211.63) 18:09 43 0
1053472 일반 돈자랑은 구글 울트라 구독은 인정해드립니다 [12] 일본에간대학원생갤로그로 이동합니다. 18:09 134 0
1053471 일반 특갤봇 사용 신청은 어디에다 함? 슈퍼130클럽갤로그로 이동합니다. 18:09 22 0
1053470 일반 자랑과 비틱이 제일 화나는거 ㅇㅇ갤로그로 이동합니다. 18:09 76 0
1053469 일반 강의팔의하는거 무슨 내용인지 아는사람잇음? ㅇㅇ갤로그로 이동합니다. 18:09 35 0
1053468 일반 요새 지피티 왤케 아프냐.. ㅇㅇ(183.107) 18:09 31 0
1053467 일반 내 인생목표가 AI LLM 더 발전하면 1인 사업하는건데 HuosAI갤로그로 이동합니다. 18:08 57 0
1053466 일반 아니 자랑 해 시발 ㅋㅋ 누가 자랑하지 말래? [6] ㅇㅇ갤로그로 이동합니다. 18:08 226 9
1053465 일반 뭔내용이었음?? [1] 영원히맑음갤로그로 이동합니다. 18:08 80 0
1053464 일반 LLM으로 돈버는거 가능함 ㅇㅇ갤로그로 이동합니다. 18:07 71 0
1053463 일반 성향을 떠나 아직도 분위기 파악이 안 되면 [12] EXERCENS갤로그로 이동합니다. 18:07 169 0
1053462 일반 아니 왜 지워!!!!!! [3] 봄바다갤로그로 이동합니다. 18:07 115 0
1053461 일반 그 특갤은 돈자랑 갤러리가 아니에요.. ㅇㅇ(210.97) 18:07 56 0
1053460 일반 걍 돈자랑은 이거임 [20] 얀르쿤갤로그로 이동합니다. 18:06 247 0
1053459 일반 코덱스 써본 사람들 이거 진짜 공감될듯 [4] 절대알바아님갤로그로 이동합니다. 18:06 136 0
1053458 일반 근데진짜자랑하고싶으면부기를뿌리면되잔아. ㅇㅇ갤로그로 이동합니다. 18:06 37 0
1053456 일반 돈을 벌고싶다면 b2b를 개발하자 ㅇㅇ갤로그로 이동합니다. 18:06 44 0
1053454 일반 그냥 싫어 특슝좍 << 이거임 걍... [3] ㅁㄱㅌㅊ갤로그로 이동합니다. 18:05 75 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2