디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[🏆베스트] 오픈AI - Deep Research 신기능 소개

초존도초갤로그로 이동합니다. 2025.02.03 09:34:36
조회 5100 추천 29 댓글 12
														


2025년 2월 2일

Deep Research 소개



심층 연구(딥리서치)는 추론 능력을 활용하여 방대한 온라인 정보를 종합하고, 사용자를 대신하여 여러 단계로 이루어진 연구 과제를 완수하는 에이전트입니다. 오늘 Pro 사용자에게 먼저 제공되며, Plus 및 Team 사용자에게는 곧 제공될 예정입니다.



1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a224d464d70bd4e45071412b951dddcfb0cb7b137ee49146698



오늘 저희는 복잡한 과제에 대해 인터넷에서 다단계 연구를 수행하는 새로운 에이전트 기능인 챗GPT 심층 연구를 출시합니다. 사람이 여러 시간 걸릴 일을 단 몇십 분 만에 해냅니다.


심층 연구는 OpenAI의 차세대 에이전트로, 사용자에게 프롬프트를 받으면 챗GPT가 수백 개의 온라인 소스를 찾아 분석 및 종합하여 연구 분석가 수준의 종합 보고서를 작성합니다. 웹 브라우징 및 데이터 분석에 최적화된 차세대 OpenAI o3 모델 버전을 기반으로 하며, 추론 능력을 활용하여 인터넷상의 방대한 텍스트, 이미지, PDF를 검색, 해석, 분석하고, 필요한 경우 발견한 정보에 따라 방향을 전환합니다.


지식을 종합하는 능력은 새로운 지식 창출의 필수 조건입니다. 이러한 이유로 심층 연구는 오랫동안 저희가 구상해 온, 획기적인 과학 연구를 수행할 수 있는 AGI 개발이라는 더 큰 목표를 향한 중요한 발걸음을 의미합니다.



심층 연구를 개발한 이유


심층 연구는 금융, 과학, 정책, 엔지니어링과 같이 고도의 지식 노동에 종사하며 철저하고 정확하며 신뢰할 수 있는 연구가 필요한 사람들을 위해 개발되었습니다. 자동차, 가전제품, 가구와 같이 신중한 연구가 필요한 구매에 대해 초개인화된 추천을 찾는 현명한 소비자에게도 똑같이 유용할 수 있습니다. 모든 결과물은 명확한 출처와 사고 과정 요약과 함께 완벽하게 문서화되어 정보를 쉽게 참조하고 확인할 수 있습니다. 특히 수많은 웹사이트를 탐색해야 찾을 수 있는 틈새의 비직관적인 정보를 찾는 데 효과적입니다. 심층 연구는 단 한 번의 쿼리로 복잡하고 시간이 많이 소요되는 웹 연구를 위임하고 신속하게 처리할 수 있도록 하여 귀중한 시간을 절약해 줍니다.


심층 연구는 웹 전체에서 독립적으로 통찰력을 발견하고 추론하며 통합합니다. 이를 위해 OpenAI의 첫 번째 추론 모델인 OpenAI o1의 배후에 있는 것과 동일한 강화 학습 방법을 사용하여 브라우저 및 Python 도구 사용이 필요한 실제 과제에 대해 훈련되었습니다. o1은 코딩, 수학 및 기타 기술 분야에서 뛰어난 능력을 보여주지만, 많은 실제 문제에서는 다양한 온라인 소스에서 광범위한 맥락과 정보 수집이 필요합니다. 심층 연구는 이러한 추론 능력을 기반으로 이러한 격차를 해소하여 사람들이 직장과 일상 생활에서 직면하는 유형의 문제를 해결할 수 있도록 합니다.



심층 연구 사용 방법


챗GPT 메시지 작성기에서 '심층 연구'를 선택하고 쿼리를 입력하세요. 스트리밍 플랫폼에 대한 경쟁 분석이든, 최고의 통근용 자전거에 대한 맞춤형 보고서이든 필요한 것을 챗GPT에 알려주세요. 질문에 맥락을 더하기 위해 파일이나 스프레드시트를 첨부할 수 있습니다. 실행이 시작되면 수행된 단계와 사용된 출처에 대한 요약이 사이드바에 나타납니다.


심층 연구는 웹을 깊이 탐색하는 데 필요한 시간을 감안하여 작업을 완료하는 데 5분에서 30분 정도 걸릴 수 있습니다. 그동안 자리를 비우거나 다른 작업을 할 수 있으며, 연구가 완료되면 알림을 받게 됩니다. 최종 결과물은 채팅 내 보고서 형태로 제공되며, 향후 몇 주 안에 명확성과 맥락을 더하기 위해 보고서에 이미지, 데이터 시각화 및 기타 분석 결과물도 포함할 예정입니다.


심층 연구와 비교했을 때 GPT-4o는 실시간 멀티모달 대화에 이상적입니다. 깊이와 세부 정보가 중요한 다각적이고 특정 영역에 특화된 문의의 경우, 심층 연구의 광범위한 탐색 능력과 각 주장에 대한 출처 표시는 빠른 요약과 업무 결과물로 사용할 수 있는 잘 문서화되고 검증된 답변 간의 차이를 만듭니다.



1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a274d4645abcf655540e7f1f6d0b5eb241aa54321fedb5c0da2


링크에 들어가서 직접 확인해보기



작동 방식


심층 연구는 광범위한 영역에 걸쳐 어려운 브라우징 및 추론 과제에 대한 엔드투엔드 강화 학습을 사용하여 훈련되었습니다. 이러한 훈련을 통해 필요한 데이터를 찾기 위한 다단계 궤적을 계획하고 실행하며, 필요한 경우 실시간 정보에 대응하여 방향을 전환하는 방법을 학습했습니다. 또한 이 모델은 사용자가 업로드한 파일을 탐색하고, Python 도구를 사용하여 그래프를 그리고 반복하며, 생성된 그래프와 웹사이트의 이미지를 모두 응답에 삽입하고, 출처에서 특정 문장이나 구절을 인용할 수 있습니다. 이러한 훈련의 결과로 실제 문제에 초점을 맞춘 여러 공개 평가에서 새로운 최고점을 기록했습니다.



인류 최후의 시험 (Humanity's Last Exam)


최근 공개된 전문가 수준의 질문으로 광범위한 주제에 걸쳐 AI를 테스트하는 평가인 인류 최후의 시험(새 창에서 열기)에서 심층 연구를 구동하는 모델은 26.6%의 정확도로 새로운 최고점을 기록했습니다. 이 시험은 언어학에서 로켓 과학, 고전에서 생태학에 이르기까지 100개 이상의 주제에 걸쳐 3,000개 이상의 객관식 및 단답형 질문으로 구성됩니다. OpenAI o1과 비교했을 때 화학, 인문학 및 사회 과학, 수학에서 가장 큰 개선이 나타났습니다. 심층 연구를 구동하는 모델은 필요할 때 전문 정보를 효과적으로 찾는 인간과 유사한 접근 방식을 보여주었습니다.



1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a294d474b42dc3659e942a3464a676d440d8ab8e49fcd836e




GAIA


실제 질문에 대해 AI를 평가하는 공개 벤치마크인 GAIA(새 창에서 열기)¹에서 심층 연구를 구동하는 모델은 새로운 최고 수준(SOTA)에 도달하여 외부 리더보드(새 창에서 열기)에서 1위를 차지했습니다. 세 가지 난이도 수준에 걸친 질문을 포함하는 이러한 과제를 성공적으로 완료하려면 추론, 멀티모달 유창성, 웹 브라우징 및 도구 사용 능력이 필요합니다.



1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a284d454ed91ccf5f9e876f5107e40ac15fb5375a9ed3c1f1




GAIA 과제 예시



1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662a284d414fa42471b1050d9bc88760230121bc7fc220e665dab7




전문가 수준 과제


다양한 영역에 걸친 전문가 수준 과제에 대한 내부 평가에서 심층 연구는 여러 시간의 어렵고 수동적인 조사를 자동화한 것으로 해당 분야 전문가로부터 평가받았습니다.



1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662b214d464eb0ed068083f4d9aa7d463dd149ff3411dd9f1b92




전문가 수준 과제 예시



1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662b204d4544dc7f8b3a258efe9252dcee76c4d78db85ebc85537b


링크에 들어가서 직접 확인해보기


1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662b204d464f6893ca7318ed3c4ab3274fa88053c6ecc1a0f807



과제의 예상 경제적 가치는 사람이 소요하는 시간보다 합격률과 더 관련성이 높습니다. 모델이 어려워하는 것은 사람이 시간 소모적이라고 느끼는 것과 다릅니다.



1ebec223e0dc2bae61ab96e746837170bd0503a3336c1f024a51662b224d454ee6800a0d10f7a686d1167d3eccddc88946ed6d94dd


동영상 보기



제한 사항


심층 연구는 획기적인 새로운 기능을 제공하지만, 아직 초기 단계이며 제한 사항이 있습니다. 내부 평가에 따르면 기존 챗GPT 모델보다 훨씬 낮은 비율이지만, 응답에서 사실을 날조하거나 잘못된 추론을 할 수 있습니다. 권위 있는 정보와 소문을 구별하는 데 어려움을 겪을 수 있으며, 현재 자신감 보정에서 약점을 보여 불확실성을 정확하게 전달하지 못하는 경우가 많습니다. 출시 시 보고서 및 인용에 사소한 형식 오류가 있을 수 있으며, 과제가 시작되는 데 시간이 더 오래 걸릴 수 있습니다. 이러한 모든 문제는 사용량 증가와 시간 경과에 따라 빠르게 개선될 것으로 예상합니다.



접근 권한


챗GPT 심층 연구는 현재 컴퓨팅 집약도가 매우 높습니다. 쿼리 연구에 시간이 오래 걸릴수록 더 많은 추론 컴퓨팅이 필요합니다. 오늘 Pro 사용자에게 월 최대 100개의 쿼리를 제공하는 최적화된 버전으로 시작합니다. Plus 및 Team 사용자는 다음에 액세스 권한을 얻고, 그 다음 Enterprise 사용자 순입니다. 영국, 스위스 및 유럽 경제 지역의 사용자에게 액세스 권한을 제공하기 위해 여전히 노력하고 있습니다.


모든 유료 사용자는 곧 더 빠르고 비용 효율적인 심층 연구 버전을 출시할 때 훨씬 더 높은 속도 제한을 받게 될 것입니다. 이 버전은 더 작은 모델로 구동되지만 여전히 고품질 결과를 제공합니다.


향후 몇 주 및 몇 달 동안 기술 인프라를 개선하고, 현재 출시 버전을 면밀히 모니터링하며, 훨씬 더 엄격한 테스트를 수행할 것입니다. 이는 반복적 배포 원칙과 일치합니다. 모든 안전 점검이 출시 기준을 계속 충족하면 약 한 달 안에 Plus 사용자에게 심층 연구를 출시할 것으로 예상합니다.



향후 계획


심층 연구는 오늘 챗GPT 웹 버전에서 사용할 수 있으며, 이달 내에 모바일 및 데스크톱 앱으로 출시될 예정입니다. 현재 심층 연구는 개방형 웹과 업로드된 모든 파일에 액세스할 수 있습니다. 앞으로는 구독 기반 리소스나 내부 리소스와 같은 더 전문화된 데이터 소스에 연결하여 결과물의 견고성과 개인 맞춤화 수준을 더욱 높일 수 있을 것입니다.


더 나아가서는 비동기식 실제 연구 및 실행을 위해 챗GPT에서 에이전트 경험이 통합되는 것을 구상하고 있습니다. 비동기식 온라인 조사를 수행할 수 있는 심층 연구와 실제 작업을 수행할 수 있는 Operator의 결합을 통해 챗GPT는 사용자를 위해 점점 더 정교한 작업을 수행할 수 있게 될 것입니다.



자동등록방지

추천 비추천

29

고정닉 22

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
3006 설문 여행 같이 다니면 고난이 예상되는 스타는? 운영자 25/04/28 - -
571617 공지 뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250427) ㅇㅇ갤로그로 이동합니다. 24.11.23 32197 43
609935 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [1] ㅇㅇ갤로그로 이동합니다. 25.01.18 14119 29
571620 공지 본 갤러리는 타 갤러리 분탕과 관계 없음을 밝힙니다. ㅇㅇ갤로그로 이동합니다. 24.11.23 5472 15
572292 공지 직업 비하, 조롱 글 30일 차단됩니다. ㅇㅇ갤로그로 이동합니다. 24.11.24 4790 6
713149 일반 팔란티어랑 미국 정부도 협업하나보네 ㅇㅇ(1.226) 12:36 47 0
713148 일반 2.5 플래쉬 라이브 벤치 종합점수 69점이네 ㅇㅇ갤로그로 이동합니다. 12:36 51 0
713147 일반 SKT진짜 거지같네 ㅇㅇ(58.29) 12:34 78 1
713146 일반 근데 제미니 울트라 나오면 어드밴스드 유저 2.5pro제한 하는거 아님? [3] ㅇㅇ(125.248) 12:31 88 0
713145 일반 재미니 이전채팅참조 한글지원 언제되냐 ㅇㅇ갤로그로 이동합니다. 12:23 29 0
713144 일반 왜 죄다 STEM 자폐아 새끼들 밖에 없냐 [1] ㅇㅇ(122.44) 12:21 132 0
713143 일반 제미니 2.5프로 어느정도 자율성 있음? [6] ㅇㅇ(119.66) 12:16 149 1
713141 일반 샘알트만이 곧 능지가 물보다 싸진다던데 [10] Dippie갤로그로 이동합니다. 12:02 335 1
713140 일반 121 유동이 써준 phi-4 reasoning 다수결 저거 ㅇㅇ­갤로그로 이동합니다. 11:58 100 0
713139 일반 아마존 노바 모델에 대해선 벤치 나온거 없나? ㅇㅇ(1.226) 11:54 38 0
713138 일반 수학과에서 AI 기반 theorem prover 씀? [13] ㅇㅇ(169.211) 11:47 257 0
713137 일반 제미나이 왜 지가 버전몇인지도 모름? [16] ㅇㅇ(182.212) 11:43 328 0
713136 일반 다음 주 무언가 파바박 하고 출시 될 느낌 [3] ㅇㅇ갤로그로 이동합니다. 11:42 184 1
713135 일반 대학원에서 석사 박사들이 논문 AI로 졸라 찍어내는 중인가요? [6] ㅇㅇ갤로그로 이동합니다. 11:37 277 0
713134 일반 문명가속화는 모든인류가 이공계를 전면공부 해야하는게 아닐까 [11] ㅇㅇ갤로그로 이동합니다. 11:36 179 0
713132 일반 슈퍼그록 구독 기간 끝나고 자꾸 자동결제 시도하는데 [7] ㅇㅇ(211.224) 11:28 152 0
713131 일반 구글 CEO "크롬 매각, 사업에 큰 타격…혁신 저해할 것" ㅇㅇ(221.149) 11:27 221 2
713130 정보/ Meta, 2035년에 AI로 최대 '1조4천억 달러' 수익 예측 [6] ㅇㅇ(121.178) 11:13 321 5
713129 일반 Ai 스튜디오는 채팅방끼리 공유되지 않나요? [2] ㅇㅇ(220.71) 11:13 199 0
713128 정보/ 카카오, 한국어 특화 멀티모달 언어모델 '카나나-o' 성능 공개 [9] ㅇㅇ(58.237) 11:12 471 10
713127 정보/ 노벨상 이제모을루, 세상에 없던 새로운 거 창조해야 ai리더 될 것 [4] ㅇㅇ갤로그로 이동합니다. 10:57 401 6
713126 일반 모나리지기 요즘에 태어나서 찍은 인스타 셀카 ㅇㅇ갤로그로 이동합니다. 10:56 240 3
713124 일반 phi-4-reasoning 꽤 괜찮은 것 같은데 [4] ㅇㅇ(121.178) 10:53 177 1
713123 일반 앤트로픽은 뭔가 지금 확신에 든 상태인거 같음 [21] ㅇㅇ갤로그로 이동합니다. 10:39 754 10
713122 일반 소형모델은 진짜 금방금방 좋아지는거같네 [4] ㅇㅇ(115.139) 10:33 217 2
713121 일반 앤트로픽은 계속 내년 말 27년 초를 밀고 있네 [21] ㅇㅇ갤로그로 이동합니다. 10:31 1129 15
713120 정보/ Deepseek가 알려준 길을 따라간 MS [9] ㅇㅇ(121.178) 10:29 729 9
713119 일반 하아 시발 노동절에도 출근하니까 자2살 마렵네 [5] ㅇㅇ(211.63) 10:28 223 1
713118 일반 gpt로 처음으로 사주봤는데 이상하게나옴 [3] ㅇㅇ(61.33) 10:28 108 0
713117 일반 인간의 지능이 점점 낮아지는 것 같은데 [8] 특이점은온다갤로그로 이동합니다. 10:28 292 1
713116 일반 오픈AI 내부에 O5 프로토타입 있다 vs 없다 [7] 일본녀갤로그로 이동합니다. 10:24 268 0
713115 일반 구글은 지금 할당량 줄이고 싶어도 못줄이지 [3] ㅇㅇ(115.139) 10:23 256 1
713114 일반 . [4] Vaph갤로그로 이동합니다. 10:23 224 0
713112 일반 내가 여기서 이러는 이유 [1] ㅇㅇ(220.123) 10:16 156 0
713111 일반 Phi-4 reasoning 점수는 미쳤는디 [6] ㅇㅇ(121.178) 10:14 447 6
713110 일반 GPT 한테 4컷만화 보여줬더니, 반격편을 써주네 ㅋ [3] 무한탐구(218.234) 10:13 429 6
713109 일반 하아 딥러닝 강좌를 안 줄려나 보군 [2] ㅇㅇ(14.50) 10:11 164 0
713108 일반 구글이 뭐 갑자기 2년휴가 모드처럼 대가리에 총맞지 않고서는 [3] ㅇㅇ(175.199) 10:10 254 0
713107 일반 LLM은 부자만의 전유물 안된다 [1] chatgpt4o갤로그로 이동합니다. 10:08 132 0
713105 일반 제미니 울트라 모델이 아니라 요금제야? [4] ㅇㅇ(1.218) 10:06 305 0
713104 일반 노동 해방이건 전유물이건 상관 없는데 [5] ㅇㅇ(14.50) 10:05 112 0
713103 정보/ 제미나이 울트라 일부 사용자에게 알림 노출 [5] 갉달비갤로그로 이동합니다. 10:01 634 8
713102 일반 새로운 요금제 나오든말든 알빠노임 ㅇㅇ(118.216) 10:00 95 0
713101 일반 중학교 수학도 모르고 파이썬도 못 다루는데 볼만한 딥러닝 강좌 좀 [14] ㅇㅇ(59.26) 09:59 237 0
713100 일반 GPT, 클로드, 잼미니 써본 후기 [2] ㅇㅇ(211.197) 09:58 191 1
713097 일반 어쨌든 인간이 노동할 일은 사라질것 [3] 애웅스갤로그로 이동합니다. 09:51 159 0
713096 정보/ 아마존, 역대 최고 성능 AI 모델 '노바 프리미어' 출시 ㅇㅇ(NEWS)갤로그로 이동합니다. 09:51 390 6
713095 정보/ Phi-4 추론 기술 보고서 [7] 특술람갤로그로 이동합니다. 09:50 452 12
713094 일반 내가 뭘 잘못한걸까 [3] ㅇㅇ(222.109) 09:37 190 0
713092 일반 정보(채팅내역부터 모든 것)를 제공하면 AGI 앞당긴다 했을 때 [4] ㅇㅇ(123.141) 09:35 185 0
뉴스 제니, 데뷔 첫 ‘유퀴즈’ 출연 확정…유재석과 모처럼 재회 디시트렌드 10:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2