디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 노암 브라운, 'AI의 빠른 발전에 대해'

ㅇㅇ(121.178) 2025.04.24 19:50:32
조회 4022 추천 44 댓글 29
														


7cf3c028e2f206a26d81f6e14080736c40


오늘 OpenAI Forum에 공개된

<Thinking Machines & AI Economics: How Reasoning AI Is Rewriting the Future of Work, Science, and Strategy>

라는 제목의 영상 내용 중 발췌한 것입니다.


25년 3월 5일에 녹화된 영상이며, 공개는 어제 되었습니다.




노암 브라운 :


"우리는 9월에 o1 Preview를 발표하고 출시했고, 12월에 o1을 발표하고 출시했으며, o3를 발표했습니다.

경진 프로그래밍, 코드포스에서 o1은 1890점, 즉 89번째 백분위수를 얻었습니다.

o3는 2700점을 얻었는데, 이는 인간 전문 경진 프로그래머 중 상위 0.1%에 해당합니다.

제 생각에는 세계에서 175번째로 뛰어난 경진 프로그래머였던 것 같습니다.


우리는 그 이후로, 샘(Sam)이 강연에서 언급했듯이,

약 한두 달 전에 내부적으로 세계 상위 50위 안에 드는 모델을 보유하게 되었다고 말했습니다.

상위 50위가 아니라, 상위 50위 이내 입니다.

그리고 이 순위는 계속 높아지고 있습니다.

저는 올해 말까지 우리 모델이 경진 프로그래밍에서 초인적인 수준이 될 것이라고 완전히 확신합니다.


이것은 경진 프로그래밍입니다.

다시 말하지만, 역사적으로 인상적인 AI 결과들이 많이 있었습니다.

딥 블루는 1997년에 세계 체스 챔피언 게리 카스파로프를 이기는 AI를 만들었습니다.

그래서 제가 "우리는 초인적인 수준에서 무언가를 하고 있다"고 말할 때, 그 자체는 새로운 것이 아닙니다.

AI 역사상 그런 결과는 많았습니다.


하지만 o3가 특별한 점은 단지 경진 프로그래밍만이 아니라,

'많은 것들'을 정말 인상적으로 수행한다는 것입니다.


실제로 SWE-bench Verified라는 벤치마크가 있는데,

여기에는 실제 코딩 작업이 포함됩니다.


이 벤치마크는 인간이 풀 리퀘스트(pull request)를 제출하기 위해 하는 모든 것을 요구합니다.

o1 Preview는 41%를 얻었습니다.

이것만으로도 이미 최첨단입니다.

o1은 이 벤치마크에서 49%를 얻었습니다.

o3는 72%를 얻습니다.


그러니 아시다시피,

이 모델에는 단지 코딩에만 훈련된 것이 아님에도 불구하고 많은 실제적인 경제적 영향력이 있습니다.


로니가 말했듯이 AI는 매우 빠르게 움직이고 있다는 것을 다시 한번 강조하고 싶습니다.

왜냐하면 AI 분야 사람들을 포함하여 AI에 대한 많은 회의론을 보기 때문입니다.


제 생각에 이러한 비판의 상당 부분은 발전 속도가 너무 빨라서 발생하며,

그들이 결함으로 지적하는 많은 것들이 6개월 전에는 사실이었지만

오늘날에는 더 이상 사실이 아니거나,

앞으로 3개월 또는 6개월 후에는 반드시 사실이 아닐 수도 있다는 점 때문입니다.


예를 들어, 2023년 여름 중반 자연어 처리 학회 기조 강연에서 연사는

어떤 모델도 할 수 없는 예시로 이 프롬프트를 제시했습니다.


"블록 C가 블록 A 위에 있고, 블록 B가 별도로 테이블 위에 있다면,

블록 C를 움직이지 않고 블록 A가 블록 B 위에,

블록 B가 블록 C 위에 있는 블록 더미를 어떻게 만들 수 있는지 말해줄 수 있나요?"

라는 추론 문제입니다.

답은 사실 불가능하다는 것입니다.


기존의 어떤 언어 모델에게 이 질문을 하면 항상 어떤 종류의 답을 환각처럼 만들어내며

"네, 이렇게 하면 됩니다"라고 말했습니다.

정답은 실제로는 불가능하다는 것인데도 말이죠.


이제 우리는 o1이 즉시 이것이 불가능하다는 것을 인식한다는 것을 봅니다.

실제로 이제 GPT-4.5조차도 즉시 이것이 불가능하다는 것을 인식합니다.


그래서 저는 여러분 모두가 이것을 염두에 두시기를 바랍니다.

사람들이 "좋아, 이것은 불가능하다, 언어 모델은 이것을 할 수 없다,

그래서 언어 모델은 큰 사건이 되지 않을 것이다"라고 말할 때,


첫째로, 오늘날 현재로서도 이미 사실이 아닐 수도 있고,

둘째로, 오늘 사실이라 할지라도 3개월 또는 6개월 후에는

반드시 사실이 아닐 수도 있다는 점을 염두에 두십시오."




https://forum.openai.com/public/videos/ai-economics-in-the-forum-2025

자동등록방지

추천 비추천

44

고정닉 35

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
3004 설문 소속 연예인 논란에 잘 대응하지 못하는 것 같은 소속사는? 운영자 25/04/21 - -
571617 공지 뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250308) ㅇㅇ갤로그로 이동합니다. 24.11.23 31305 42
609935 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [1] ㅇㅇ갤로그로 이동합니다. 25.01.18 12592 27
571620 공지 본 갤러리는 타 갤러리 분탕과 관계 없음을 밝힙니다. [1] ㅇㅇ갤로그로 이동합니다. 24.11.23 5387 15
572292 공지 직업 비하, 조롱 글 30일 차단됩니다. ㅇㅇ갤로그로 이동합니다. 24.11.24 4683 6
710804 일반 와 gpt o3랑 입씨름해도 모르갰는거 젬프로쓰니까 뷰빔갤로그로 이동합니다. 14:30 0 0
710803 일반 젬황 평정의 시대. ㅇㅇ(119.196) 14:29 4 0
710802 일반 Webdevarena에 sunstrike 올라온거 Protactinium갤로그로 이동합니다. 14:28 14 0
710801 일반 특린이인데 agi 질문좀 [1] 야끼교자갤로그로 이동합니다. 14:25 18 0
710800 일반 공홈 veo가 더 안좋은점 [1] 갉달비갤로그로 이동합니다. 14:21 45 0
710799 일반 LLM 이미지인식 보면 선천적 시각장애인 일화 생각남 [2] 빗소리P갤로그로 이동합니다. 14:17 85 1
710798 일반 ai가 동영상도 보고 학습하는 기술 개발중임?? ㅇㅇ갤로그로 이동합니다. 14:17 28 0
710797 일반 oai는 진짜 사용자가 많은 게 단점이네 ㅋㅋ [1] 메론맛콜라가먹고싶어갤로그로 이동합니다. 14:16 120 0
710796 일반 한국이 포르노.성인물이 불법인 나라이긴 하지만... ㅇㅇ갤로그로 이동합니다. 14:14 108 0
710795 일반 나도 개념글대로 해도 못찾는데 ㅇㅇ(115.139) 14:12 44 0
710794 일반 o3 환각 좀 다른 원인이 있을거 같은데 [1] ㅇㅇ갤로그로 이동합니다. 14:11 96 2
710793 일반 포켓몬 적버전 ai가 정복하면 다음 겜은 뭘까 [1] 웰치스빈갤로그로 이동합니다. 14:09 54 0
710792 일반 개념글대로 위치 못찾는데 [6] chatgpt4o갤로그로 이동합니다. 14:05 131 0
710791 일반 음성모드 영어 회화 연습 괜찮음? ㅇㅇ(39.118) 14:02 28 0
710790 일반 5억년 버튼 갖고 또 싸우네 [44] ㅇㅇ갤로그로 이동합니다. 13:55 279 0
710789 일반 잼미니 = 공앱 잼황=ais , 공웹 [4] 끼랑까랑갤로그로 이동합니다. 13:52 161 1
710788 일반 저출산 걱정도 사실 가스라이팅이지 [4] ㅇㅇ(118.176) 13:50 137 0
710787 일반 포켓몬 관련해서 oai 짜치는 점 [4] ㅇㅇ(27.124) 13:49 141 4
710786 일반 4월의 승자 모델은 누구일까 [5] 갉달비갤로그로 이동합니다. 13:47 158 2
710785 일반 깃허브에 자가의학진단 에이전트 올리면 법쪽으로 문제있나? [4] ㅇㅇ(125.242) 13:46 98 0
710784 일반 o1 pro vs o3 머가 더 나음? [1] ㅇㅇ(112.153) 13:45 73 0
710783 일반 잼민이 2.5 프로도 멍청함 천문학 잘 모름 ㅇㅇ(183.107) 13:41 70 0
710782 일반 GPT는 너무빨아줘서 공부할때는 그록 잼민이써야함 [3] ㅇㅇ갤로그로 이동합니다. 13:40 127 1
710780 일반 지금 21살 다이아수저로 살기 vs 20년후 21살 다이아수저 [6] ㅇㅇ(112.153) 13:35 147 0
710778 일반 근데 젬황은 이미지를 직접 읽는다매 [5] ㅇㅇ(115.139) 13:31 202 0
710777 일반 젬황... [23] ㅇㅇ(220.89) 13:28 1128 20
710776 일반 구글 io가 5월 며칠에 하는 거임? 한국 시간 기준으로 [1] ㅇㅇ갤로그로 이동합니다. 13:26 80 1
710775 일반 아니 제미니 미쳤는데? [5] 페어웨이굴삭기갤로그로 이동합니다. 13:26 262 1
710774 일반 투표)GPT-5 출시 월 예상 분노의라스갤로그로 이동합니다. 13:20 151 1
710773 일반 gpt 알아서 만들어줄테니 기다리라는 [1] ㅇㅇ(59.14) 13:18 98 0
710772 일반 gpt 4o 프롬 길이제한 무료 이용자만 걸리는거임?? ☎세미나인♪갤로그로 이동합니다. 13:18 88 1
710771 일반 만약에 특이점이 온 ai 로봇에 귀신이 깃든다면 [8] 밴조갤로그로 이동합니다. 13:07 152 0
710769 일반 Gemini 포켓몬 벤치의 의의는 딱 하나임 ㅇㅇ [4] ArchitectOT갤로그로 이동합니다. 13:01 323 6
710768 일반 재미니 우쭈쭈 [3] (1.224) 12:59 155 0
710767 일반 강화학습 말고는 AGI 답 없어보임 [7] 덕수옹갤로그로 이동합니다. 12:56 282 1
710766 일반 코딩 원툴 쏘넷이냐? [1] ㅇㅇ(182.208) 12:56 67 0
710765 일반 지피티 업데이트 됨? [1] ㅇㅇ(1.226) 12:55 154 0
710764 일반 사용량이 많다고 성능이 떨어지나? [1] ㅇㅇ(14.53) 12:51 92 0
710763 일반 근데 요즘 벤치 너무 많아짐 [5] ㅇㅇ갤로그로 이동합니다. 12:46 170 0
710762 일반 옆동네에 제미나이 쓰다 정지당한거 있내 ㅋㅋ [4] ㅇㅇ갤로그로 이동합니다. 12:42 677 9
710761 일반 왜 법조계•의료계는 ai에 아직 대체되지 않았는가? [28] ㅇㅇ갤로그로 이동합니다. 12:41 320 3
710760 일반 제미니 앱은 진짜 쓰기 불편하네 ㅇㅇ(211.215) 12:41 78 0
710759 일반 챗gpt는 도대체 어디 자료를 기반으로 알려주는거임??? [4] ㅇㅇㅇ1갤로그로 이동합니다. 12:36 173 0
710758 일반 gpt한테 뭐 소스 만들어달라고 하니까 몇시간을 기다려 달라는데 [1] ㅇㅇ(115.22) 12:35 57 0
710757 일반 챗지피티vs제미니 결제하려는데 뭐가 좋나요 [9] ㅇㅇ갤로그로 이동합니다. 12:34 160 0
710755 일반 근데 애초에 제미니 포켓몬은 딥마인드가 돌리는게 아님 [1] ㅇㅇ(220.83) 12:29 128 3
710754 일반 재미나이 구독 안하고 걍 ais 쓰면 됨? [6] BODIE갤로그로 이동합니다. 12:27 199 0
710753 일반 Ai studio는 모바일 안되지? [3] ㅇㅇ(211.217) 12:23 171 0
710752 일반 LLM의 창의성에 대한 데미스 하사비스 인터뷰 [3] ㅇㅇ(222.109) 12:22 225 3
710751 일반 4o요즘 너무 간신배 같아짐 [9] ㅇㅇ(49.109) 12:20 274 5
뉴스 “입구서 저 찾아도 없어요”…신지, 초상권 무단 사용에 일침 디시트렌드 04.26
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2