오픈AI - Deep Research 신기능 소개

초존도초 · 2025.02.03 09:34:36

2025년 2월 2일

Deep Research 소개

심층 연구(딥리서치)는 추론 능력을 활용하여 방대한 온라인 정보를 종합하고, 사용자를 대신하여 여러 단계로 이루어진 연구 과제를 완수하는 에이전트입니다. 오늘 Pro 사용자에게 먼저 제공되며, Plus 및 Team 사용자에게는 곧 제공될 예정입니다.

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a224d464d70bd4e45071412b951dddcfb0cb7b137ee49146698

오늘 저희는 복잡한 과제에 대해 인터넷에서 다단계 연구를 수행하는 새로운 에이전트 기능인 챗GPT 심층 연구를 출시합니다. 사람이 여러 시간 걸릴 일을 단 몇십 분 만에 해냅니다.

심층 연구는 OpenAI의 차세대 에이전트로, 사용자에게 프롬프트를 받으면 챗GPT가 수백 개의 온라인 소스를 찾아 분석 및 종합하여 연구 분석가 수준의 종합 보고서를 작성합니다. 웹 브라우징 및 데이터 분석에 최적화된 차세대 OpenAI o3 모델 버전을 기반으로 하며, 추론 능력을 활용하여 인터넷상의 방대한 텍스트, 이미지, PDF를 검색, 해석, 분석하고, 필요한 경우 발견한 정보에 따라 방향을 전환합니다.

지식을 종합하는 능력은 새로운 지식 창출의 필수 조건입니다. 이러한 이유로 심층 연구는 오랫동안 저희가 구상해 온, 획기적인 과학 연구를 수행할 수 있는 AGI 개발이라는 더 큰 목표를 향한 중요한 발걸음을 의미합니다.

심층 연구를 개발한 이유

심층 연구는 금융, 과학, 정책, 엔지니어링과 같이 고도의 지식 노동에 종사하며 철저하고 정확하며 신뢰할 수 있는 연구가 필요한 사람들을 위해 개발되었습니다. 자동차, 가전제품, 가구와 같이 신중한 연구가 필요한 구매에 대해 초개인화된 추천을 찾는 현명한 소비자에게도 똑같이 유용할 수 있습니다. 모든 결과물은 명확한 출처와 사고 과정 요약과 함께 완벽하게 문서화되어 정보를 쉽게 참조하고 확인할 수 있습니다. 특히 수많은 웹사이트를 탐색해야 찾을 수 있는 틈새의 비직관적인 정보를 찾는 데 효과적입니다. 심층 연구는 단 한 번의 쿼리로 복잡하고 시간이 많이 소요되는 웹 연구를 위임하고 신속하게 처리할 수 있도록 하여 귀중한 시간을 절약해 줍니다.

심층 연구는 웹 전체에서 독립적으로 통찰력을 발견하고 추론하며 통합합니다. 이를 위해 OpenAI의 첫 번째 추론 모델인 OpenAI o1의 배후에 있는 것과 동일한 강화 학습 방법을 사용하여 브라우저 및 Python 도구 사용이 필요한 실제 과제에 대해 훈련되었습니다. o1은 코딩, 수학 및 기타 기술 분야에서 뛰어난 능력을 보여주지만, 많은 실제 문제에서는 다양한 온라인 소스에서 광범위한 맥락과 정보 수집이 필요합니다. 심층 연구는 이러한 추론 능력을 기반으로 이러한 격차를 해소하여 사람들이 직장과 일상 생활에서 직면하는 유형의 문제를 해결할 수 있도록 합니다.

심층 연구 사용 방법

챗GPT 메시지 작성기에서 '심층 연구'를 선택하고 쿼리를 입력하세요. 스트리밍 플랫폼에 대한 경쟁 분석이든, 최고의 통근용 자전거에 대한 맞춤형 보고서이든 필요한 것을 챗GPT에 알려주세요. 질문에 맥락을 더하기 위해 파일이나 스프레드시트를 첨부할 수 있습니다. 실행이 시작되면 수행된 단계와 사용된 출처에 대한 요약이 사이드바에 나타납니다.

심층 연구는 웹을 깊이 탐색하는 데 필요한 시간을 감안하여 작업을 완료하는 데 5분에서 30분 정도 걸릴 수 있습니다. 그동안 자리를 비우거나 다른 작업을 할 수 있으며, 연구가 완료되면 알림을 받게 됩니다. 최종 결과물은 채팅 내 보고서 형태로 제공되며, 향후 몇 주 안에 명확성과 맥락을 더하기 위해 보고서에 이미지, 데이터 시각화 및 기타 분석 결과물도 포함할 예정입니다.

심층 연구와 비교했을 때 GPT-4o는 실시간 멀티모달 대화에 이상적입니다. 깊이와 세부 정보가 중요한 다각적이고 특정 영역에 특화된 문의의 경우, 심층 연구의 광범위한 탐색 능력과 각 주장에 대한 출처 표시는 빠른 요약과 업무 결과물로 사용할 수 있는 잘 문서화되고 검증된 답변 간의 차이를 만듭니다.

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a274d4645abcf655540e7f1f6d0b5eb241aa54321fedb5c0da2

링크에 들어가서 직접 확인해보기

작동 방식

심층 연구는 광범위한 영역에 걸쳐 어려운 브라우징 및 추론 과제에 대한 엔드투엔드 강화 학습을 사용하여 훈련되었습니다. 이러한 훈련을 통해 필요한 데이터를 찾기 위한 다단계 궤적을 계획하고 실행하며, 필요한 경우 실시간 정보에 대응하여 방향을 전환하는 방법을 학습했습니다. 또한 이 모델은 사용자가 업로드한 파일을 탐색하고, Python 도구를 사용하여 그래프를 그리고 반복하며, 생성된 그래프와 웹사이트의 이미지를 모두 응답에 삽입하고, 출처에서 특정 문장이나 구절을 인용할 수 있습니다. 이러한 훈련의 결과로 실제 문제에 초점을 맞춘 여러 공개 평가에서 새로운 최고점을 기록했습니다.

인류 최후의 시험 (Humanity's Last Exam)

최근 공개된 전문가 수준의 질문으로 광범위한 주제에 걸쳐 AI를 테스트하는 평가인 인류 최후의 시험(새 창에서 열기)에서 심층 연구를 구동하는 모델은 26.6%의 정확도로 새로운 최고점을 기록했습니다. 이 시험은 언어학에서 로켓 과학, 고전에서 생태학에 이르기까지 100개 이상의 주제에 걸쳐 3,000개 이상의 객관식 및 단답형 질문으로 구성됩니다. OpenAI o1과 비교했을 때 화학, 인문학 및 사회 과학, 수학에서 가장 큰 개선이 나타났습니다. 심층 연구를 구동하는 모델은 필요할 때 전문 정보를 효과적으로 찾는 인간과 유사한 접근 방식을 보여주었습니다.

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a294d474b42dc3659e942a3464a676d440d8ab8e49fcd836e

GAIA

실제 질문에 대해 AI를 평가하는 공개 벤치마크인 GAIA(새 창에서 열기)¹에서 심층 연구를 구동하는 모델은 새로운 최고 수준(SOTA)에 도달하여 외부 리더보드(새 창에서 열기)에서 1위를 차지했습니다. 세 가지 난이도 수준에 걸친 질문을 포함하는 이러한 과제를 성공적으로 완료하려면 추론, 멀티모달 유창성, 웹 브라우징 및 도구 사용 능력이 필요합니다.

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a284d454ed91ccf5f9e876f5107e40ac15fb5375a9ed3c1f1

GAIA 과제 예시

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a284d414fa42471b1050d9bc88760230121bc7fc220e665dab7

전문가 수준 과제

다양한 영역에 걸친 전문가 수준 과제에 대한 내부 평가에서 심층 연구는 여러 시간의 어렵고 수동적인 조사를 자동화한 것으로 해당 분야 전문가로부터 평가받았습니다.

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662b214d464eb0ed068083f4d9aa7d463dd149ff3411dd9f1b92

전문가 수준 과제 예시

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662b204d4544dc7f8b3a258efe9252dcee76c4d78db85ebc85537b

링크에 들어가서 직접 확인해보기

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662b204d464f6893ca7318ed3c4ab3274fa88053c6ecc1a0f807

과제의 예상 경제적 가치는 사람이 소요하는 시간보다 합격률과 더 관련성이 높습니다. 모델이 어려워하는 것은 사람이 시간 소모적이라고 느끼는 것과 다릅니다.

1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662b224d454ee6800a0d10f7a686d1167d3eccddc88946ed6d94dd

동영상 보기

제한 사항

심층 연구는 획기적인 새로운 기능을 제공하지만, 아직 초기 단계이며 제한 사항이 있습니다. 내부 평가에 따르면 기존 챗GPT 모델보다 훨씬 낮은 비율이지만, 응답에서 사실을 날조하거나 잘못된 추론을 할 수 있습니다. 권위 있는 정보와 소문을 구별하는 데 어려움을 겪을 수 있으며, 현재 자신감 보정에서 약점을 보여 불확실성을 정확하게 전달하지 못하는 경우가 많습니다. 출시 시 보고서 및 인용에 사소한 형식 오류가 있을 수 있으며, 과제가 시작되는 데 시간이 더 오래 걸릴 수 있습니다. 이러한 모든 문제는 사용량 증가와 시간 경과에 따라 빠르게 개선될 것으로 예상합니다.

접근 권한

챗GPT 심층 연구는 현재 컴퓨팅 집약도가 매우 높습니다. 쿼리 연구에 시간이 오래 걸릴수록 더 많은 추론 컴퓨팅이 필요합니다. 오늘 Pro 사용자에게 월 최대 100개의 쿼리를 제공하는 최적화된 버전으로 시작합니다. Plus 및 Team 사용자는 다음에 액세스 권한을 얻고, 그 다음 Enterprise 사용자 순입니다. 영국, 스위스 및 유럽 경제 지역의 사용자에게 액세스 권한을 제공하기 위해 여전히 노력하고 있습니다.

모든 유료 사용자는 곧 더 빠르고 비용 효율적인 심층 연구 버전을 출시할 때 훨씬 더 높은 속도 제한을 받게 될 것입니다. 이 버전은 더 작은 모델로 구동되지만 여전히 고품질 결과를 제공합니다.

향후 몇 주 및 몇 달 동안 기술 인프라를 개선하고, 현재 출시 버전을 면밀히 모니터링하며, 훨씬 더 엄격한 테스트를 수행할 것입니다. 이는 반복적 배포 원칙과 일치합니다. 모든 안전 점검이 출시 기준을 계속 충족하면 약 한 달 안에 Plus 사용자에게 심층 연구를 출시할 것으로 예상합니다.

향후 계획

심층 연구는 오늘 챗GPT 웹 버전에서 사용할 수 있으며, 이달 내에 모바일 및 데스크톱 앱으로 출시될 예정입니다. 현재 심층 연구는 개방형 웹과 업로드된 모든 파일에 액세스할 수 있습니다. 앞으로는 구독 기반 리소스나 내부 리소스와 같은 더 전문화된 데이터 소스에 연결하여 결과물의 견고성과 개인 맞춤화 수준을 더욱 높일 수 있을 것입니다.

더 나아가서는 비동기식 실제 연구 및 실행을 위해 챗GPT에서 에이전트 경험이 통합되는 것을 구상하고 있습니다. 비동기식 온라인 조사를 수행할 수 있는 심층 연구와 실제 작업을 수행할 수 있는 Operator의 결합을 통해 챗GPT는 사용자를 위해 점점 더 정교한 작업을 수행할 수 있게 될 것입니다.

번호	말머리	제목	글쓴이	작성일	조회	추천
3006	설문	여행 같이 다니면 고난이 예상되는 스타는?	운영자	25/04/28	-	-
571617	공지	뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250427)	ㅇㅇ	24.11.23	32197	43
609935	공지	특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [1]	ㅇㅇ	25.01.18	14119	29
571620	공지	본 갤러리는 타 갤러리 분탕과 관계 없음을 밝힙니다.	ㅇㅇ	24.11.23	5472	15
572292	공지	직업 비하, 조롱 글 30일 차단됩니다.	ㅇㅇ	24.11.24	4790	6
713149	일반	팔란티어랑 미국 정부도 협업하나보네	ㅇㅇ(1.226)	12:36	47	0
713148	일반	2.5 플래쉬 라이브 벤치 종합점수 69점이네	ㅇㅇ	12:36	51	0
713147	일반	SKT진짜 거지같네	ㅇㅇ(58.29)	12:34	78	1
713146	일반	근데 제미니 울트라 나오면 어드밴스드 유저 2.5pro제한 하는거 아님? [3]	ㅇㅇ(125.248)	12:31	88	0
713145	일반	재미니 이전채팅참조 한글지원 언제되냐	ㅇㅇ	12:23	29	0
713144	일반	왜 죄다 STEM 자폐아 새끼들 밖에 없냐 [1]	ㅇㅇ(122.44)	12:21	132	0
713143	일반	제미니 2.5프로 어느정도 자율성 있음? [6]	ㅇㅇ(119.66)	12:16	149	1
713141	일반	샘알트만이 곧 능지가 물보다 싸진다던데 [10]	Dippie	12:02	335	1
713140	일반	121 유동이 써준 phi-4 reasoning 다수결 저거	ㅇㅇ	11:58	100	0
713139	일반	아마존 노바 모델에 대해선 벤치 나온거 없나?	ㅇㅇ(1.226)	11:54	38	0
713138	일반	수학과에서 AI 기반 theorem prover 씀? [13]	ㅇㅇ(169.211)	11:47	257	0
713137	일반	제미나이 왜 지가 버전몇인지도 모름? [16]	ㅇㅇ(182.212)	11:43	328	0
713136	일반	다음 주 무언가 파바박 하고 출시 될 느낌 [3]	ㅇㅇ	11:42	184	1
713135	일반	대학원에서 석사 박사들이 논문 AI로 졸라 찍어내는 중인가요? [6]	ㅇㅇ	11:37	277	0
713134	일반	문명가속화는 모든인류가 이공계를 전면공부 해야하는게 아닐까 [11]	ㅇㅇ	11:36	179	0
713132	일반	슈퍼그록 구독 기간 끝나고 자꾸 자동결제 시도하는데 [7]	ㅇㅇ(211.224)	11:28	152	0
713131	일반	구글 CEO "크롬 매각, 사업에 큰 타격…혁신 저해할 것"	ㅇㅇ(221.149)	11:27	221	2
713130	정보/ 정보/뉴스	Meta, 2035년에 AI로 최대 '1조4천억 달러' 수익 예측 [6]	ㅇㅇ(121.178)	11:13	321	5
713129	일반	Ai 스튜디오는 채팅방끼리 공유되지 않나요? [2]	ㅇㅇ(220.71)	11:13	199	0
713128	정보/ 정보/뉴스	카카오, 한국어 특화 멀티모달 언어모델 '카나나-o' 성능 공개 [9]	ㅇㅇ(58.237)	11:12	471	10
713127	정보/ 정보/뉴스	노벨상 이제모을루, 세상에 없던 새로운 거 창조해야 ai리더 될 것 [4]	ㅇㅇ	10:57	401	6
713126	일반	모나리지기 요즘에 태어나서 찍은 인스타 셀카	ㅇㅇ	10:56	240	3
713124	일반	phi-4-reasoning 꽤 괜찮은 것 같은데 [4]	ㅇㅇ(121.178)	10:53	177	1
713123	일반	앤트로픽은 뭔가 지금 확신에 든 상태인거 같음 [21]	ㅇㅇ	10:39	754	10
713122	일반	소형모델은 진짜 금방금방 좋아지는거같네 [4]	ㅇㅇ(115.139)	10:33	217	2
713121	일반	앤트로픽은 계속 내년 말 27년 초를 밀고 있네 [21]	ㅇㅇ	10:31	1129	15
713120	정보/ 정보/뉴스	Deepseek가 알려준 길을 따라간 MS [9]	ㅇㅇ(121.178)	10:29	729	9
713119	일반	하아 시발 노동절에도 출근하니까 자2살 마렵네 [5]	ㅇㅇ(211.63)	10:28	223	1
713118	일반	gpt로 처음으로 사주봤는데 이상하게나옴 [3]	ㅇㅇ(61.33)	10:28	108	0
713117	일반	인간의 지능이 점점 낮아지는 것 같은데 [8]	특이점은온다	10:28	292	1
713116	일반	오픈AI 내부에 O5 프로토타입 있다 vs 없다 [7]	일본녀	10:24	268	0
713115	일반	구글은 지금 할당량 줄이고 싶어도 못줄이지 [3]	ㅇㅇ(115.139)	10:23	256	1
713114	일반	. [4]	Vaph	10:23	224	0
713112	일반	내가 여기서 이러는 이유 [1]	ㅇㅇ(220.123)	10:16	156	0
713111	일반	Phi-4 reasoning 점수는 미쳤는디 [6]	ㅇㅇ(121.178)	10:14	447	6
713110	일반	GPT 한테 4컷만화 보여줬더니, 반격편을 써주네 ㅋ [3]	무한탐구(218.234)	10:13	429	6
713109	일반	하아 딥러닝 강좌를 안 줄려나 보군 [2]	ㅇㅇ(14.50)	10:11	164	0
713108	일반	구글이 뭐 갑자기 2년휴가 모드처럼 대가리에 총맞지 않고서는 [3]	ㅇㅇ(175.199)	10:10	254	0
713107	일반	LLM은 부자만의 전유물 안된다 [1]	chatgpt4o	10:08	132	0
713105	일반	제미니 울트라 모델이 아니라 요금제야? [4]	ㅇㅇ(1.218)	10:06	305	0
713104	일반	노동 해방이건 전유물이건 상관 없는데 [5]	ㅇㅇ(14.50)	10:05	112	0
713103	정보/ 정보/뉴스	제미나이 울트라 일부 사용자에게 알림 노출 [5]	갉달비	10:01	634	8
713102	일반	새로운 요금제 나오든말든 알빠노임	ㅇㅇ(118.216)	10:00	95	0
713101	일반	중학교 수학도 모르고 파이썬도 못 다루는데 볼만한 딥러닝 강좌 좀 [14]	ㅇㅇ(59.26)	09:59	237	0
713100	일반	GPT, 클로드, 잼미니 써본 후기 [2]	ㅇㅇ(211.197)	09:58	191	1
713097	일반	어쨌든 인간이 노동할 일은 사라질것 [3]	애웅스	09:51	159	0
713096	정보/ 정보/뉴스	아마존, 역대 최고 성능 AI 모델 '노바 프리미어' 출시	ㅇㅇ(NEWS)	09:51	390	6
713095	정보/ 정보/뉴스	Phi-4 추론 기술 보고서 [7]	특술람	09:50	452	12
713094	일반	내가 뭘 잘못한걸까 [3]	ㅇㅇ(222.109)	09:37	190	0
713092	일반	정보(채팅내역부터 모든 것)를 제공하면 AGI 앞당긴다 했을 때 [4]	ㅇㅇ(123.141)	09:35	185	0
	뉴스	제니, 데뷔 첫 ‘유퀴즈’ 출연 확정…유재석과 모처럼 재회	디시트렌드	10:00

갤러리 검색

최근 방문

즐겨찾기

즐겨찾기 갤러리

특이점이 온다 갤러리
마이너

머리말∙꼬리말

머리말∙꼬리말

색상 설정

스포일러 경고 설정

제목에서 경고

본문에서 경고

마이너 갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

마이너 갤러리 소개

차단하기

[특이점이 온다 갤러리]

갤러리 본문 영역

[🏆베스트] 오픈AI - Deep Research 신기능 소개

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

파워링크 광고

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

실시간 베스트

뉴스

디시미디어

디시이슈

개념글[나는 솔로]

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘