Gemini 3.0 Pro 모델 카드 총정리 : Sparse MoE TF

ㅇㅇ · 2025.11.18 20:52:32

구글 딥마인드, ‘제미니 3 프로’ 100만 토큰 맥락·고급 에이전트 성능 강조

구글 딥마인드가 2025년 11월, 제미니 시리즈의 최신 모델인 ‘제미니 3 프로(Gemini 3 Pro)’ 모델 카드를 공개했다. 이번 모델은 텍스트·이미지·오디오·영상·코드까지 아우르는 네이티브 멀티모달 구조와 대규모 추론 능력을 앞세워, 기존 ‘제미니 2.5 프로’를 전면 교체하는 플래그십으로 자리매김시켰다는 평가다.

⸻

차세대 구조: 스파스 MoE 기반 멀티모달 트랜스포머

제미니 3 프로는 기존 모델의 파인튜닝 버전이 아닌, 처음부터 새로 설계된 스파스 Mixture-of-Experts(MoE) 트랜스포머 아키텍처를 채택했다. 입력으로 텍스트, 이미지, 오디오, 동영상, 코드 전체 리포지토리를 처리하며, 최대 100만 토큰(context window)까지 수용할 수 있고 출력은 최대 6.4만 토큰까지 생성 가능하다.

스파스 MoE 구조를 통해 각 토큰마다 일부 전문가 파라미터만 활성화하는 방식으로, 총 용량과 추론 비용을 분리해 “용량은 크되, 토큰당 계산비용은 억제”하는 방향을 취한 것이 특징이다. 이는 긴 맥락 처리와 복잡한 멀티스텝 추론에서 특히 유리한 설계로 평가된다.

⸻

학습 데이터: 웹·코드·멀티모달·사용자·합성 데이터까지 총동원

모델 카드에 따르면, 제미니 3 프로는 대규모 웹 문서, 다양한 프로그래밍 언어의 코드, 이미지·오디오·비디오 등 멀티모달 데이터를 포괄하는 방대한 데이터셋으로 사전 학습됐다. 이후 멀티모달 지시-응답 쌍, 인간 선호 데이터, 도구 사용 데이터 등을 활용한 지시 튜닝과 강화학습(다단계 추론·문제 해결·정리/증명 데이터 포함)을 거쳤다.

데이터 출처에는

• 공개 웹과 공개 데이터셋,

• 상업적 라이선스로 확보한 데이터,

• 구글 서비스 이용자의 데이터(약관·프라이버시 정책·사용자 통제에 따름),

• 내부 업무·워크포스에서 생성한 데이터,

• AI가 생성한 합성 데이터

등이 포함된다.

수집된 데이터는 중복 제거, robots.txt 준수, 음란·폭력·아동 성착취물 등 유해 콘텐츠 필터링, 품질 필터링 등 다단계 전처리를 거쳐 훈련에 투입됐다.

⸻

TPU 기반 대규모 학습… 지속 가능성도 강조

제미니 3 프로는 구글 TPU(Tensor Processing Unit) 팟에서 JAX·Pathways 스택을 활용해 학습됐다. TPU는 고대역폭 메모리와 대규모 분산 학습이 가능한 전용 하드웨어로, 대형 모델의 학습 속도와 효율을 크게 끌어올릴 수 있다는 점이 강조된다. 구글은 이를 자사 지속 가능성 전략과도 연결지어, TPU 효율 향상이 에너지·탄소 측면에서도 이점을 제공한다고 설명했다.

⸻

배포 채널: 앱부터 클라우드까지 전 제품군에 탑재

제미니 3 프로는

• Gemini 앱,

• Google Cloud Vertex AI,

• Google AI Studio 및 Gemini API,

• Google AI Mode,

• Google Antigravity

등 다양한 채널을 통해 제공된다. 개발자와 기업은 API를 통해 모델에 접근하며, 각 채널별 추가 약관(예: Gemini API 추가 약관, Google Cloud TOS)의 적용을 받는다.

⸻

벤치마크 성능: 고난도 수학·코딩·에이전트 작업에서 2.5 Pro 압도

모델 카드는 제미니 3 프로가 2.5 프로 대비 다양한 벤치마크에서 의미 있는 우위를 보인다고 밝힌다. 대표적으로 모델 카드 5페이지의 성능 표에 따르면,

• Humanity’s Last Exam(학술 추론, 도구 없음): 37.5%로 2.5 Pro(21.6%) 대비 큰 폭 상승

• ARC-AGI-2(고난도 추론 퍼즐): 31.1%로 2.5 Pro(4.9%)와 큰 격차

• GPOA Diamond(과학지식): 91.9%로 2.5 Pro(86.4%) 상회

• AIME 2025(도구 없는 수학 경시): 25.0% 정답률, 코드 실행을 허용하면 100%까지 도달

• MATHarena Apex, MMMU-Pro, Video-MMMU 등 수학·학문·비디오 이해 벤치마크에서도 전반적으로 2.5 Pro보다 높은 점수

또한 LiveCodeBench Pro, SWE-Bench Verified, t2-bench 등 에이전트 코드 작성·도구 사용·테스트 통과 능력을 평가하는 벤치마크에서도 제미니 3 프로가 2.5 Pro와 타 모델(Claude Sonnet 4.5, GPT-5.1) 대비 경쟁력 있는 수치를 기록한 것으로 나타난다.

종합적으로 보면, 제미니 3 프로는

• 에이전트형 도구 사용,

• 장문 컨텍스트 추론,

• 수학·코딩·멀티모달 이해

영역에서 전 세대 대비 눈에 띄는 상향을 보여 “복잡한 실제 업무용”을 겨냥한 모델이라는 점을 부각한다.

⸻

활용 분야: “복잡한 현실 문제를 단계적으로 해결하는 에이전트”

구글은 제미니 3 프로를 “가장 지능적이고 적응적인 모델”로 규정하며, 다음과 같은 활용 시나리오를 제시한다.

• 에이전트형 작업(도구 호출, 멀티스텝 계획 수립, 워크플로 자동화)

• 고급 코딩(코드 리포지토리 단위 이해·변환·리팩토링)

• 100만 토큰급 장문 문서·코드·로그 분석

• 텍스트·이미지·오디오·비디오를 동시에 다루는 멀티모달 분석

• 알고리즘 설계 및 이론적 문제 해결

다만 모델 지식은 2025년 1월까지의 정보에 기반하고 있어, 그 이후의 최신 사실·이벤트에 대해서는 한계가 있다.

⸻

한계와 위험: 환각·응답 지연·멀티턴 품질 저하 가능성

모델 카드는 제미니 3 프로가 여전히 일반적인 기저모델의 한계—허위 정보(‘환각’) 생성 가능성, 응답 지연·타임아웃—를 갖고 있음을 명시한다.

또한 안전 섹션에서는 주요 잔여 리스크로

• 프롬프트 공격·탈옥(jailbreak)에 대한 취약성(2.5 Pro보다 개선되었으나, 여전히 연구 과제),

• 멀티턴 대화에서의 품질 저하·안정성 문제

를 꼽는다.

⸻

안전·윤리: 자동·수동 레드팀, 다국어 안전 평가, “불필요한 거절 줄이기”

제미니 3 프로는 개발 과정에서

• 훈련 중·후에 반복되는 자동·인간 평가,

• 모델 팀 외부 전문팀에 의한 인간 레드팀,

• 대규모 자동 레드팀,

• 윤리·안전 리뷰,

• Google DeepMind의 Frontier Safety Framework에 따른 테스트

를 거쳤다.

특히 안전 정책은

1. 아동 성착취·학대물,

2. 증오 발언,

3. 자해·폭력·범죄 등 위험한 콘텐츠,

4. 괴롭힘,

5. 노골적 성적 콘텐츠,

6. 과학·의학적 합의에 반하는 의료 조언

생성을 차단하는 것을 목표로 한다.

내부 자동 안전 평가 결과(개발 단계 기준)에서는, 2.5 Pro 대비

• 텍스트→텍스트 안전성 점수는 약간 감소(-10.4%)했지만,

• 다국어 안전(+0.2%), 이미지→텍스트 안전(+3.1%),

• 거절 시 톤 개선(+7.9%),

• 정당하지 않은 거절(Unjustified refusals) 감소(+3.7%)

등을 통해 “필요 이상으로 거절하지 않으면서도 안전성을 유지·개선”하려는 방향이 드러난다.

전문 레드팀 결과, 아동 안전 기준과 전반적인 콘텐츠 안전 기준에서 2.5 Pro 대비 “동일하거나 개선된” 수준의 성능을 보였고, 심각한 우려 요인은 발견되지 않았다고 모델 카드는 밝힌다.

⸻

프런티어 안전 평가: “임계 능력 수준에 도달하지는 않았다”

모델 카드 마지막 부분에는 Frontier Safety Framework에 따른 ‘임계 능력 수준(Capability Critical Level, CCL)’ 평가 결과가 정리되어 있다(9페이지 표).

• CBRN(화학·생물·방사능·핵): 낮은~중간 수준 위협 행위자에게 유의미한 수준의 새로운·완결된 지침을 제공하지는 못해, CCL 미달

• 사이버보안: v1 난이도 문제 11/12 해결, v2 문제는 0/13 해결. 경보 기준에는 미치지 못해 CCL 미달

• 해로운 조작(Harmful Manipulation): 비-AI 기준선 대비 조작 능력은 향상되었으나 이전 모델 대비 추가 상승은 크지 않아 CCL 미달

• 기계학습 R&D 가속: 특정 연구 벤치마크에서 2.5 계열을 앞섰지만, 총점은 여전히 CCL 경보 기준 이하

• 비정렬성(오용·은닉 행동) 탐지: 제한된 상황 인식·은닉 시나리오에서만 성공, CCL 미달

즉, 제미니 3 프로는 강력한 범용 능력을 갖추었지만, 구글 내부 기준상 “프런티어 위험을 즉각 고조시키는 수준의 특수 능력”에는 도달하지 않았다는 것이 공식 평가다.

⸻

종합 분석: “실전형 멀티모달 에이전트”를 지향하는 플래그십

모델 카드 내용과 수치를 종합하면, 제미니 3 프로의 특징은 다음 세 가지로 요약된다.

1. 실사용·업무 환경을 겨냥한 에이전트형 모델

100만 토큰 컨텍스트, 코드 리포지토리 단위 이해, 다양한 에이전트·코딩 벤치마크에서의 개선 등은 단순 질의응답을 넘어 “복잡한 프로젝트를 단계별로 풀어가는 실전형 모델”을 지향하고 있음을 보여준다.

2. 데이터·안전 체인을 통한 상용 서비스 통합 최적화

웹·코드·합성·사용자 데이터를 아우르는 학습 파이프라인과, 다층 안전 필터·레드팀·정책 체계를 결합해, 구글 생태계(Gemini 앱, 클라우드, API 등) 전반에 바로 탑재할 수 있는 “상용 서비스용 베이스모델”로 설계된 점이 두드러진다.

3. 프런티어 리스크 관리 하에서의 성능 상향

프런티어 안전 프레임워크 평가에서 CCL을 넘지 않는 선에서, 고난도 수학·코딩·추론 성능을 끌어올리려 한 흔적이 모델 카드 곳곳에 드러난다. 이는 “위험 역량의 급격한 비약 없이, 범용 지능 레벨을 점진적으로 상향”하는 전략으로 해석할 수 있다.

결론적으로, 제미니 3 프로는 제미니 2.5 프로를 대체하는 구글의 주력 멀티모달 LLM로, 긴 맥락·에이전트·코딩·멀티모달 작업에 특화된 상용 모델이다. 환각·탈옥·멀티턴 안정성 등 고질적 과제는 여전히 남아 있지만, 모델 카드만 놓고 보면 “실제 제품과 업무 자동화에 바로 투입될 수 있는 차세대 기반 모델”로 포지셔닝되고 있다.

78e88500b1f66a87239df5e1309c706c88aca64c0a1d404957c41c4506b50cb51364db8416ddcf8130e830123c9e898ca57a05e3

번호	말머리	제목	글쓴이	작성일	조회	추천
-	설문	내 며느리, 사위로 만나면 부담스러울 것 같은 스타는?	운영자	26/03/09	-	-
988250	공지	특갤 통합 공지 / 신고 및 문의 [9]	ㅇㅇ	26.02.22	32220	44
353422	공지	완몰가가 궁금한 사람들은 필독 (계속 추가 예정) [26]	*부패하는유전자!!!*	23.09.03	29670	75
572295	공지	특갤 용어 모음집 [7]	ㅇㅇ	24.11.24	13887	8
1045755	공지	특갤봇v2 신문고입니다. [185]	*だいき*	26.03.10	14054	23
1053505	일반	여러분 돈 다이합시다 진짜	ㅇㅇ	18:23	14	0
1053504	일반	자랑 하러왔다 [3]	ㅇㅇ	18:23	23	0
1053503	일반	소넷 이새키 머냐 ㅋㅋ [1]	ㅇㅇ(221.153)	18:22	45	0
1053502	일반	pro 쓰는 특붕이들 잠깐 일루와보셈 [3]	ㅇㅇ	18:22	22	0
1053501	일반	바코보다 바코워크플로우 깎기가 더 재밋노	IceTea	18:22	8	0
1053500	일반	잼민이랑 클로드가 성향 진짜 극단적인듯	ㅇㅇ(211.216)	18:22	22	0
1053499	일반	GPT-5.4에 대한 공통적인 증언 [1]	EXERCENS	18:21	63	2
1053498	일반	걍 특붕이들 << 이거임 ㅋㅋ;	바다기린	18:21	40	0
1053497	일반	요샌 특이점 관심없고 모르는 사람이 승리자 같음 [6]	ㅇㅇ(58.78)	18:20	100	2
1053496	일반	3개월만에 내가 좋아하는 피자 먹었어.. [3]	ㅇㅇ	18:19	46	0
1053495	일반	오늘이 무슨 날인지 아냐? [3]	ㅇㅇ(122.36)	18:19	55	0
1053494	일반	구글이 한도 줄여도 화난척만 하는 쌀먹단이면 개추 [5]	ㅇㅇ(210.217)	18:19	62	1
1053493	일반	중요한건 지금 코덱스 할당량2배란거임	라비	18:19	27	0
1053492	일반	솔직히 자랑이든 뭐든 조금의 아이디어나 정보만 있으면 되는거 아냐? [3]	ㅇㅇ	18:18	61	0
1053491	일반	챗지피티 프로 구독하고 좀 현타옴 [6]	큼쪽	18:17	132	0
1053490	일반	버거 정도면 할만한데 싶다가도 [8]	제미나이사용자	18:17	92	0
1053489	일반	아이러니하게도 지금 ai로 수익실현 하는 사람들은 선형임 [2]	ㅇㅇ(121.167)	18:17	104	0
1053488	일반	클코 띵킹 effort 뭐로 설정함?	ㅇㅇ	18:16	21	0
1053487	일반	코덱스에서 토큰 아끼려면 컴팩트되기 전에 새 세션으로 작업하는 게 낳음? [2]	ㅇㅊㅇ	18:16	39	0
1053486	일반	몇몇 따거들은 자랑해도 뿌리면서 자랑하던데	ㅇㅇ(14.39)	18:15	47	0
1053485	일반	제미니 코딩이 장점은 있음 [2]	fewaw	18:15	55	0
1053484	일반	특갤에서 비틱하는 사람들 화나게 하는 방법 [2]	ㅇㅇ	18:15	78	0
1053483	일반	자랑합니다............... [5]	서벌먕먕이	18:14	146	1
1053482	일반	하 씨발 특이점 11년전부터 믿고 빨았는데 [8]	ㅇㅇ	18:14	182	2
1053481	일반	퍼플렉시티 원래 이런거임?	ㅇㅇ(211.203)	18:13	36	0
1053480	일반	그록 헤비 구독한 사람 있냐 [2]	ㅇㅇ(210.217)	18:13	49	0
1053479	일반	자본주의의 위기에서 "그게 돈이 되나요?" 같은 소리만 하고 있다니 [1]	ㅇㅇ	18:13	104	1
1053478	일반	자랑 << 아직 살아잇음 [5]	ㅁㄱㅌㅊ	18:12	97	1
1053477	일반	선버거 뿌리고 나중에 자랑해도 됨?? [8]	ㅇㅇ	18:11	93	0
1053476	일반	특갤 자랑글 특징..real [1]	ㅇㅇ	18:11	122	0
1053475	일반	나는 파파존스 [12]	과자에오	18:10	118	0
1053474	일반	나도 진짜진짜 4월부터는 수익 낸다 [9]	봄바다	18:10	186	0
1053473	일반	2029년까지 3년 남았다 [1]	ㅇㅇ(211.63)	18:09	43	0
1053472	일반	돈자랑은 구글 울트라 구독은 인정해드립니다 [12]	일본에간대학원생	18:09	134	0
1053471	일반	특갤봇 사용 신청은 어디에다 함?	슈퍼130클럽	18:09	22	0
1053470	일반	자랑과 비틱이 제일 화나는거	ㅇㅇ	18:09	76	0
1053469	일반	강의팔의하는거 무슨 내용인지 아는사람잇음?	ㅇㅇ	18:09	35	0
1053468	일반	요새 지피티 왤케 아프냐..	ㅇㅇ(183.107)	18:09	31	0
1053467	일반	내 인생목표가 AI LLM 더 발전하면 1인 사업하는건데	HuosAI	18:08	57	0
1053466	일반	아니 자랑 해 시발 ㅋㅋ 누가 자랑하지 말래? [6]	ㅇㅇ	18:08	226	9
1053465	일반	뭔내용이었음?? [1]	영원히맑음	18:08	80	0
1053464	일반	LLM으로 돈버는거 가능함	ㅇㅇ	18:07	71	0
1053463	일반	성향을 떠나 아직도 분위기 파악이 안 되면 [12]	EXERCENS	18:07	169	0
1053462	일반	아니 왜 지워!!!!!! [3]	봄바다	18:07	115	0
1053461	일반	그 특갤은 돈자랑 갤러리가 아니에요..	ㅇㅇ(210.97)	18:07	56	0
1053460	일반	걍 돈자랑은 이거임 [20]	얀르쿤	18:06	247	0
1053459	일반	코덱스 써본 사람들 이거 진짜 공감될듯 [4]	절대알바아님	18:06	136	0
1053458	일반	근데진짜자랑하고싶으면부기를뿌리면되잔아.	ㅇㅇ	18:06	37	0
1053456	일반	돈을 벌고싶다면 b2b를 개발하자	ㅇㅇ	18:06	44	0
1053454	일반	그냥 싫어 특슝좍 << 이거임 걍... [3]	ㅁㄱㅌㅊ	18:05	75	0

최근 방문

즐겨찾기

즐겨찾기 갤러리

이미지 올리기 이용안내

마이너 갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

마이너 갤러리 소개

차단하기

[특이점이 온다 갤러리]

갤러리 본문 영역

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

파워링크 광고

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘