AI 모델에서 "그것"은 데이터셋이다. - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] AI 모델에서 "그것"은 데이터셋이다.

ㅇㅇ(61.73) 2024.04.25 12:02:33

조회 1765 추천 24 댓글 7

AI 모델에서 "그것"은 데이터셋이다.

2023년 6월 10일 jbetker 작성

저는 거의 1년간 OpenAI에서 근무해 왔습니다. 그 시간 동안 저는 많은 생성 모델을 훈련시켰습니다. 사실상 누구도 그렇게 많이 훈련시킬 권리가 없을 정도로 많이요. 여러 모델 구성과 하이퍼파라미터를 조정하면서 관찰한 시간 동안, 모든 훈련 실행 사이에 유사성이 있다는 것이 점점 뚜렷해졌습니다.

이 모델들이 그들의 데이터셋을 놀랍도록 정교하게 근사화하고 있다는 사실이 점점 분명해지고 있습니다. 이것이 의미하는 바는 그들이 개나 고양이가 무엇인지를 배우는 것뿐만 아니라, 사람들이 자주 찍는 사진이나 흔히 쓰는 단어와 같은 중요하지 않은 분포 사이의 빈도를 배운다는 것입니다.

이는 충분한 가중치와 훈련 시간을 가진 모든 모델들이 같은 데이터셋으로 충분히 오래 훈련되면 거의 모두 동일한 지점으로 수렴한다는 것으로 나타납니다. 충분히 큰 diffusion conv-unets는 ViT 생성기와 동일한 이미지를 생성합니다. AR 샘플링은 diffusion과 동일한 이미지를 생성합니다.

이는 놀라운 관찰입니다! 이것은 모델 행동이 아키텍처, 하이퍼파라미터 또는 최적화 선택에 의해 결정되지 않는다는 것을 의미합니다. 그것은 당신의 데이터셋에 의해 결정됩니다, 그 밖의 다른 것은 없습니다. 다른 모든 것은 그 데이터셋을 효율적으로 근사화하기 위해 계산을 전달하는 수단에 불과합니다.

그러므로 우리가 '람다', '챗GPT', '바드', '클로드'를 언급할 때, 모델 가중치를 언급하는 것이 아닙니다. 그것은 데이터셋을 말하는 것입니다.

The “it” in AI models is the dataset.

Posted on June 10, 2023 by jbetker

I’ve been at OpenAI for almost a year now. In that time, I’ve trained a lot of generative models. More than anyone really has any right to train. As I’ve spent these hours observing the effects of tweaking various model configurations and hyperparameters, one thing that has struck me is the similarities in between all the training runs.

It’s becoming awfully clear to me that these models are truly approximating their datasets to an incredible degree. What that means is not only that they learn what it means to be a dog or a cat, but the interstitial frequencies between distributions that don’t matter, like what photos humans are likely to take or words humans commonly write down.

What this manifests as is – trained on the same dataset for long enough, pretty much every model with enough weights and training time converges to the same point. Sufficiently large diffusion conv-unets produce the same images as ViT generators. AR sampling produces the same images as diffusion.

This is a surprising observation! It implies that model behavior is not determined by architecture, hyperparameters, or optimizer choices. It’s determined by your dataset, nothing else. Everything else is a means to an end in efficiently delivery compute to approximating that dataset.

Then, when you refer to “Lambda”, “ChatGPT”, “Bard”, or “Claude” then, it’s not the model weights that you are referring to. It’s the dataset.

개념글에 올라온 글이 중요한 내용이라고 생각되는데 한글번역이 약간 난해한 부분이 있어서 클로드+GPT4 조합으로 재번역 해 봤다.

https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=459454

고정닉 10

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2861	설문	어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는?	운영자	24/05/20	-	-
412470	공지	레이 커즈와일 신간 6월 25일 발매 [29]	모브	24.01.24	7554	32
242613	공지	특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3040]	*특갤용*	23.08.06	38781	43
433260	공지	웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1]	*부패하는유전자!!!*	24.03.06	2441	2
363220	공지	선형글 삭제 기준 [7]	*특갤용*	23.10.14	7109	24
375493	공지	필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40]	ㅇㅇ(182.230)	23.11.11	13170	122
373402	공지	직업 비하, 조롱 글 30일 차단됩니다. [51]	*특갤용*	23.11.07	8821	79
385147	공지	구글의 AGI 분류 체계 [17]	ㅇㅇ	23.11.22	8211	31
332612	공지	음모론 삭제 기준을 안내드립니다. [23]	*특갤용*	23.08.25	9036	30
259237	공지	특갤 용어 모음집 [6]	*특갤용*	23.08.09	22587	33
482750	일반	어떻게 좆노이만이랑 갓알트만을 비교하냐 [1]	ㅇㅇ(211.179)	18:12	20	0
482749	일반	알트만은 인공지능에 대해서 거의 모르는 수준임 [2]	ㅇㅇ(59.31)	18:11	46	0
482748	일반	멸종하면 큰일나는 생선 [2]	황룡	18:03	96	0
482747	일반	어떻게 좆트만이랑 폰노이만을 비교하냐 [4]	ㅇㅇ	18:03	81	0
482746	일반	현시대의 천재들은 과거 천재들 보다 떨어진다고봄? [18]	ㅇㅇ(59.0)	17:57	126	0
482745	일반	일(노동)은 원래 좆같음 [1]	ㅇㅇ	17:52	85	0
482744	일반	역노화 같은거 보다 더 시급한게 밥임 [8]	ㅇㅇ(175.202)	17:44	134	0
482743	일반	진짜 발전속도 존나게 답답하다 ㅋㅋㅋㅋ [9]	ㅇㅇ(222.108)	17:32	277	1
482742	일반	오래생각해봤는데 노동 자체가 너무 지성인이 할만한게 아닌듯 [7]	ㅇㅇ	17:31	120	2
482741	일반	작년에 올해는 번역쪽만 기대된다고 했는데 [10]	파이어독	17:24	209	1
482740	일반	제미니 프로 1.5한테 유튜브 영상 요약해달라고 해봄 [3]	rtOS	17:22	100	0
482739	일반	진짜 특이점 언제 오는거임? [3]	ㅇㅇ(222.120)	17:21	95	0
482738	일반	맑스 갈수록 재평가 될 수 있음?? [13]	ㅇㅇ(103.237)	17:20	177	2
482737	일반	다양한 언어로 제미니1.5 번역 성능 테스트해봄 [2]	ㅇㅇ(220.124)	17:18	100	2
482736	일반	나는 현재 openai 내부 모델 성능이 궁금하다 [5]	ㅇㅇ(220.123)	17:14	145	0
482735	일반	5월에 겨울이라니...	ㅇㅇ(211.184)	17:14	28	0
482734	일반	2095년은 어떤 모습일거 같음? [7]	ㅇㅇ	17:11	102	3
482733	역노화	근데 만약 역노화만 오고... [3]	ㅇㅇ	17:10	91	0
482732	일반	와 개씹 겨울이네 [1]	ㅇㅇ(121.128)	17:07	83	0
482731	일반	특이점 안오면 급식들은 ㄹㅇ 절망이지 [3]	xdxd333	17:06	186	2
482730	일반	2010년대의 발전이 저평가 받는건 어쩔 수 없음 [4]	ㅇㅇ(211.184)	17:05	100	1
482729	일반	4o가 진짜 웃기는 모델이긴 하다	ㅇㅇ(59.6)	17:03	97	0
482728	일반	대체 우리 아버지 어머니 세대들은 '논문' 이거 어떻게 쓴거냐? [28]	ㅇㅇ(58.29)	16:47	467	9
482727	일반	레커처럼 2029년 agi 믿는애들은 없냐 [9]	연맛	16:43	170	1
482726	일반	전 세계가 언어의 장벽만 극복해도 발전속도 훨씬 빨라질듯 [1]	ㅇㅇ	16:41	127	1
482725	일반	갤주는 죽어도 갤주다 [3]	ㅇㅇ(114.202)	16:37	98	0
482724	일반	근데 ㄹㅇ 지니가 단일 신경망 말하던 그 지니임? [24]	ㅇㅇ(103.237)	16:35	259	0
482723	일반	일단 2012년에 두번째 ai겨울이 끝났는데 [1]	ㅇㅇ(114.202)	16:33	114	0
482722	일반	난 ㄹㅇ 스마트폰이 없었으면 어땠을까?하는 생각이 자주 들긴함 [5]	ㅇㅇ(103.237)	16:31	115	1
482721	일반	특이점이 진짜 곧 오겠구나 [6]	열심히해보자	16:28	323	0
482720	일반	AI로 쇼츠 만들어서 팔아먹는 애들도 많았구나 [5]	열심히해보자	16:27	242	0
482719	일반	25년에 agi안나오면 일론신뢰도는 사라지는거임 [8]	ㅇㅇ(59.11)	16:27	133	0
482718	일반	한문번역 조온나 신기한데 [2]	ㅇㅇ(59.19)	16:22	151	0
482717	일반	1924 // 2024 달라진점 [5]	ㅇㅇ(59.11)	16:20	145	1
482716	일반	2004년이랑2024년 비교하니까 스마트폰 하나라도 있지	ㅇㅇ(219.254)	16:18	74	0
482715	일반	결국 타고남이 문제네 [1]	ㅇㅇ	16:17	78	0
482714	일반	내가 느낀 ChatGPT [2]	야옹이(27.35)	16:17	130	1
482713	일반	자기가 옳은지 남으로 확인하지마라.. [4]	ㅇㅇ(59.6)	16:15	120	0
482712	일반	10년대가 겉보기에는 발전속도 떨어져보이긴 하는듯 [4]	ㅇㅇ(114.202)	16:13	171	3
482711	일반	글고보니 디시자체도 2010년대랑 바뀐게있긴하네	ㅇㅇ(59.11)	16:08	96	1
482710	일반	2014년이 살기가 더 좋았던거 같음 [17]	ㅇㅇ(223.39)	16:04	256	1