노암 브라운, 'AI의 빠른 발전에 대해' - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

" Don't Die "

매니저

sama(prince2317)

부매니저

퐁칸8(zxvw157) かみ(thank346…) VPN차단용(near1254) 카러닐(fasten97…) 디비휴(runny783…) DNA(hexase1) Asi(worship5…) et(evgz6v8f…)

개설일

2019-08-01

[정보/뉴스] 노암 브라운, 'AI의 빠른 발전에 대해'

ㅇㅇ(121.178) 2025.04.24 19:50:32

조회 4022 추천 44 댓글 29

7cf3c028e2f206a26d81f6e14080736c40

오늘 OpenAI Forum에 공개된

라는 제목의 영상 내용 중 발췌한 것입니다.

25년 3월 5일에 녹화된 영상이며, 공개는 어제 되었습니다.

노암 브라운 :

"우리는 9월에 o1 Preview를 발표하고 출시했고, 12월에 o1을 발표하고 출시했으며, o3를 발표했습니다.

경진 프로그래밍, 코드포스에서 o1은 1890점, 즉 89번째 백분위수를 얻었습니다.

o3는 2700점을 얻었는데, 이는 인간 전문 경진 프로그래머 중 상위 0.1%에 해당합니다.

제 생각에는 세계에서 175번째로 뛰어난 경진 프로그래머였던 것 같습니다.

우리는 그 이후로, 샘(Sam)이 강연에서 언급했듯이,

약 한두 달 전에 내부적으로 세계 상위 50위 안에 드는 모델을 보유하게 되었다고 말했습니다.

상위 50위가 아니라, 상위 50위 이내 입니다.

그리고 이 순위는 계속 높아지고 있습니다.

저는 올해 말까지 우리 모델이 경진 프로그래밍에서 초인적인 수준이 될 것이라고 완전히 확신합니다.

이것은 경진 프로그래밍입니다.

다시 말하지만, 역사적으로 인상적인 AI 결과들이 많이 있었습니다.

딥 블루는 1997년에 세계 체스 챔피언 게리 카스파로프를 이기는 AI를 만들었습니다.

그래서 제가 "우리는 초인적인 수준에서 무언가를 하고 있다"고 말할 때, 그 자체는 새로운 것이 아닙니다.

AI 역사상 그런 결과는 많았습니다.

하지만 o3가 특별한 점은 단지 경진 프로그래밍만이 아니라,

'많은 것들'을 정말 인상적으로 수행한다는 것입니다.

실제로 SWE-bench Verified라는 벤치마크가 있는데,

여기에는 실제 코딩 작업이 포함됩니다.

이 벤치마크는 인간이 풀 리퀘스트(pull request)를 제출하기 위해 하는 모든 것을 요구합니다.

o1 Preview는 41%를 얻었습니다.

이것만으로도 이미 최첨단입니다.

o1은 이 벤치마크에서 49%를 얻었습니다.

o3는 72%를 얻습니다.

그러니 아시다시피,

이 모델에는 단지 코딩에만 훈련된 것이 아님에도 불구하고 많은 실제적인 경제적 영향력이 있습니다.

로니가 말했듯이 AI는 매우 빠르게 움직이고 있다는 것을 다시 한번 강조하고 싶습니다.

왜냐하면 AI 분야 사람들을 포함하여 AI에 대한 많은 회의론을 보기 때문입니다.

제 생각에 이러한 비판의 상당 부분은 발전 속도가 너무 빨라서 발생하며,

그들이 결함으로 지적하는 많은 것들이 6개월 전에는 사실이었지만

오늘날에는 더 이상 사실이 아니거나,

앞으로 3개월 또는 6개월 후에는 반드시 사실이 아닐 수도 있다는 점 때문입니다.

예를 들어, 2023년 여름 중반 자연어 처리 학회 기조 강연에서 연사는

어떤 모델도 할 수 없는 예시로 이 프롬프트를 제시했습니다.

"블록 C가 블록 A 위에 있고, 블록 B가 별도로 테이블 위에 있다면,

블록 C를 움직이지 않고 블록 A가 블록 B 위에,

블록 B가 블록 C 위에 있는 블록 더미를 어떻게 만들 수 있는지 말해줄 수 있나요?"

라는 추론 문제입니다.

답은 사실 불가능하다는 것입니다.

기존의 어떤 언어 모델에게 이 질문을 하면 항상 어떤 종류의 답을 환각처럼 만들어내며

"네, 이렇게 하면 됩니다"라고 말했습니다.

정답은 실제로는 불가능하다는 것인데도 말이죠.

이제 우리는 o1이 즉시 이것이 불가능하다는 것을 인식한다는 것을 봅니다.

실제로 이제 GPT-4.5조차도 즉시 이것이 불가능하다는 것을 인식합니다.

그래서 저는 여러분 모두가 이것을 염두에 두시기를 바랍니다.

사람들이 "좋아, 이것은 불가능하다, 언어 모델은 이것을 할 수 없다,

그래서 언어 모델은 큰 사건이 되지 않을 것이다"라고 말할 때,

첫째로, 오늘날 현재로서도 이미 사실이 아닐 수도 있고,

둘째로, 오늘 사실이라 할지라도 3개월 또는 6개월 후에는

반드시 사실이 아닐 수도 있다는 점을 염두에 두십시오."

https://forum.openai.com/public/videos/ai-economics-in-the-forum-2025

고정닉 35

원본 첨부파일 1

1.png

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
3004	설문	소속 연예인 논란에 잘 대응하지 못하는 것 같은 소속사는?	운영자	25/04/21	-	-
571617	공지	뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250308)	ㅇㅇ	24.11.23	31305	42
609935	공지	특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [1]	ㅇㅇ	25.01.18	12592	27
571620	공지	본 갤러리는 타 갤러리 분탕과 관계 없음을 밝힙니다. [1]	ㅇㅇ	24.11.23	5387	15
572292	공지	직업 비하, 조롱 글 30일 차단됩니다.	ㅇㅇ	24.11.24	4683	6
710804	일반	와 gpt o3랑 입씨름해도 모르갰는거 젬프로쓰니까	뷰빔	14:30	0	0
710803	일반	젬황 평정의 시대.	ㅇㅇ(119.196)	14:29	4	0
710802	일반	Webdevarena에 sunstrike 올라온거	Protactinium	14:28	14	0
710801	일반	특린이인데 agi 질문좀 [1]	야끼교자	14:25	18	0
710800	일반	공홈 veo가 더 안좋은점 [1]	갉달비	14:21	45	0
710799	일반	LLM 이미지인식 보면 선천적 시각장애인 일화 생각남 [2]	빗소리P	14:17	85	1
710798	일반	ai가 동영상도 보고 학습하는 기술 개발중임??	ㅇㅇ	14:17	28	0
710797	일반	oai는 진짜 사용자가 많은 게 단점이네 ㅋㅋ [1]	메론맛콜라가먹고싶어	14:16	120	0
710796	일반	한국이 포르노.성인물이 불법인 나라이긴 하지만...	ㅇㅇ	14:14	108	0
710795	일반	나도 개념글대로 해도 못찾는데	ㅇㅇ(115.139)	14:12	44	0
710794	일반	o3 환각 좀 다른 원인이 있을거 같은데 [1]	ㅇㅇ	14:11	96	2
710793	일반	포켓몬 적버전 ai가 정복하면 다음 겜은 뭘까 [1]	웰치스빈	14:09	54	0
710792	일반	개념글대로 위치 못찾는데 [6]	chatgpt4o	14:05	131	0
710791	일반	음성모드 영어 회화 연습 괜찮음?	ㅇㅇ(39.118)	14:02	28	0
710790	일반	5억년 버튼 갖고 또 싸우네 [44]	ㅇㅇ	13:55	279	0
710789	일반	잼미니 = 공앱 잼황=ais , 공웹 [4]	끼랑까랑	13:52	161	1
710788	일반	저출산 걱정도 사실 가스라이팅이지 [4]	ㅇㅇ(118.176)	13:50	137	0
710787	일반	포켓몬 관련해서 oai 짜치는 점 [4]	ㅇㅇ(27.124)	13:49	141	4
710786	일반	4월의 승자 모델은 누구일까 [5]	갉달비	13:47	158	2
710785	일반	깃허브에 자가의학진단 에이전트 올리면 법쪽으로 문제있나? [4]	ㅇㅇ(125.242)	13:46	98	0
710784	일반	o1 pro vs o3 머가 더 나음? [1]	ㅇㅇ(112.153)	13:45	73	0
710783	일반	잼민이 2.5 프로도 멍청함 천문학 잘 모름	ㅇㅇ(183.107)	13:41	70	0
710782	일반	GPT는 너무빨아줘서 공부할때는 그록 잼민이써야함 [3]	ㅇㅇ	13:40	127	1
710780	일반	지금 21살 다이아수저로 살기 vs 20년후 21살 다이아수저 [6]	ㅇㅇ(112.153)	13:35	147	0
710778	일반	근데 젬황은 이미지를 직접 읽는다매 [5]	ㅇㅇ(115.139)	13:31	202	0
710777	일반	젬황... [23]	ㅇㅇ(220.89)	13:28	1128	20
710776	일반	구글 io가 5월 며칠에 하는 거임? 한국 시간 기준으로 [1]	ㅇㅇ	13:26	80	1
710775	일반	아니 제미니 미쳤는데? [5]	페어웨이굴삭기	13:26	262	1
710774	일반	투표)GPT-5 출시 월 예상	분노의라스	13:20	151	1
710773	일반	gpt 알아서 만들어줄테니 기다리라는 [1]	ㅇㅇ(59.14)	13:18	98	0
710772	일반	gpt 4o 프롬 길이제한 무료 이용자만 걸리는거임??	☎세미나인♪	13:18	88	1
710771	일반	만약에 특이점이 온 ai 로봇에 귀신이 깃든다면 [8]	밴조	13:07	152	0
710769	일반	Gemini 포켓몬 벤치의 의의는 딱 하나임 ㅇㅇ [4]	ArchitectOT	13:01	323	6
710768	일반	재미니 우쭈쭈 [3]	썰(1.224)	12:59	155	0
710767	일반	강화학습 말고는 AGI 답 없어보임 [7]	덕수옹	12:56	282	1
710766	일반	코딩 원툴 쏘넷이냐? [1]	ㅇㅇ(182.208)	12:56	67	0
710765	일반	지피티 업데이트 됨? [1]	ㅇㅇ(1.226)	12:55	154	0
710764	일반	사용량이 많다고 성능이 떨어지나? [1]	ㅇㅇ(14.53)	12:51	92	0
710763	일반	근데 요즘 벤치 너무 많아짐 [5]	ㅇㅇ	12:46	170	0
710762	일반	옆동네에 제미나이 쓰다 정지당한거 있내 ㅋㅋ [4]	ㅇㅇ	12:42	677	9
710761	일반	왜 법조계•의료계는 ai에 아직 대체되지 않았는가? [28]	ㅇㅇ	12:41	320	3
710760	일반	제미니 앱은 진짜 쓰기 불편하네	ㅇㅇ(211.215)	12:41	78	0
710759	일반	챗gpt는 도대체 어디 자료를 기반으로 알려주는거임??? [4]	ㅇㅇㅇ1	12:36	173	0
710758	일반	gpt한테 뭐 소스 만들어달라고 하니까 몇시간을 기다려 달라는데 [1]	ㅇㅇ(115.22)	12:35	57	0
710757	일반	챗지피티vs제미니 결제하려는데 뭐가 좋나요 [9]	ㅇㅇ	12:34	160	0
710755	일반	근데 애초에 제미니 포켓몬은 딥마인드가 돌리는게 아님 [1]	ㅇㅇ(220.83)	12:29	128	3
710754	일반	재미나이 구독 안하고 걍 ais 쓰면 됨? [6]	BODIE	12:27	199	0
710753	일반	Ai studio는 모바일 안되지? [3]	ㅇㅇ(211.217)	12:23	171	0
710752	일반	LLM의 창의성에 대한 데미스 하사비스 인터뷰 [3]	ㅇㅇ(222.109)	12:22	225	3
710751	일반	4o요즘 너무 간신배 같아짐 [9]	ㅇㅇ(49.109)	12:20	274	5
	뉴스	“입구서 저 찾아도 없어요”…신지, 초상권 무단 사용에 일침	디시트렌드	04.26