디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] AI 모델에서 "그것"은 데이터셋이다.

ㅇㅇ(61.73) 2024.04.25 12:02:33
조회 1765 추천 24 댓글 7
														

AI 모델에서 "그것"은 데이터셋이다.


2023년 6월 10일 jbetker 작성

저는 거의 1년간 OpenAI에서 근무해 왔습니다. 그 시간 동안 저는 많은 생성 모델을 훈련시켰습니다. 사실상 누구도 그렇게 많이 훈련시킬 권리가 없을 정도로 많이요. 여러 모델 구성과 하이퍼파라미터를 조정하면서 관찰한 시간 동안, 모든 훈련 실행 사이에 유사성이 있다는 것이 점점 뚜렷해졌습니다.


이 모델들이 그들의 데이터셋을 놀랍도록 정교하게 근사화하고 있다는 사실이 점점 분명해지고 있습니다. 이것이 의미하는 바는 그들이 개나 고양이가 무엇인지를 배우는 것뿐만 아니라, 사람들이 자주 찍는 사진이나 흔히 쓰는 단어와 같은 중요하지 않은 분포 사이의 빈도를 배운다는 것입니다.


이는 충분한 가중치와 훈련 시간을 가진 모든 모델들이 같은 데이터셋으로 충분히 오래 훈련되면 거의 모두 동일한 지점으로 수렴한다는 것으로 나타납니다. 충분히 큰 diffusion conv-unets는 ViT 생성기와 동일한 이미지를 생성합니다. AR 샘플링은 diffusion과 동일한 이미지를 생성합니다.


이는 놀라운 관찰입니다! 이것은 모델 행동이 아키텍처, 하이퍼파라미터 또는 최적화 선택에 의해 결정되지 않는다는 것을 의미합니다. 그것은 당신의 데이터셋에 의해 결정됩니다, 그 밖의 다른 것은 없습니다. 다른 모든 것은 그 데이터셋을 효율적으로 근사화하기 위해 계산을 전달하는 수단에 불과합니다.


그러므로 우리가 '람다', '챗GPT', '바드', '클로드'를 언급할 때, 모델 가중치를 언급하는 것이 아닙니다. 그것은 데이터셋을 말하는 것입니다.



The “it” in AI models is the dataset.

Posted on June 10, 2023 by jbetker

I’ve been at OpenAI for almost a year now. In that time, I’ve trained a lot of generative models. More than anyone really has any right to train. As I’ve spent these hours observing the effects of tweaking various model configurations and hyperparameters, one thing that has struck me is the similarities in between all the training runs.


It’s becoming awfully clear to me that these models are truly approximating their datasets to an incredible degree. What that means is not only that they learn what it means to be a dog or a cat, but the interstitial frequencies between distributions that don’t matter, like what photos humans are likely to take or words humans commonly write down.


What this manifests as is – trained on the same dataset for long enough, pretty much every model with enough weights and training time converges to the same point. Sufficiently large diffusion conv-unets produce the same images as ViT generators. AR sampling produces the same images as diffusion.


This is a surprising observation! It implies that model behavior is not determined by architecture, hyperparameters, or optimizer choices. It’s determined by your dataset, nothing else. Everything else is a means to an end in efficiently delivery compute to approximating that dataset.


Then, when you refer to “Lambda”, “ChatGPT”, “Bard”, or “Claude” then, it’s not the model weights that you are referring to. It’s the dataset.



개념글에 올라온 글이 중요한 내용이라고 생각되는데 한글번역이 약간 난해한 부분이 있어서 클로드+GPT4 조합으로 재번역 해 봤다.

https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=459454

 


자동등록방지

추천 비추천

24

고정닉 10

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 7554 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3040] 특갤용갤로그로 이동합니다. 23.08.06 38781 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2441 2
363220 공지 선형글 삭제 기준 [7] 특갤용갤로그로 이동합니다. 23.10.14 7109 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 13170 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [51] 특갤용갤로그로 이동합니다. 23.11.07 8821 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8211 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 9036 30
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22587 33
482750 일반 어떻게 좆노이만이랑 갓알트만을 비교하냐 [1] ㅇㅇ(211.179) 18:12 20 0
482749 일반 알트만은 인공지능에 대해서 거의 모르는 수준임 [2] ㅇㅇ(59.31) 18:11 46 0
482748 일반 멸종하면 큰일나는 생선 [2] 황룡갤로그로 이동합니다. 18:03 96 0
482747 일반 어떻게 좆트만이랑 폰노이만을 비교하냐 [4] ㅇㅇ갤로그로 이동합니다. 18:03 81 0
482746 일반 현시대의 천재들은 과거 천재들 보다 떨어진다고봄? [18] ㅇㅇ(59.0) 17:57 126 0
482745 일반 일(노동)은 원래 좆같음 [1] ㅇㅇ갤로그로 이동합니다. 17:52 85 0
482744 일반 역노화 같은거 보다 더 시급한게 밥임 [8] ㅇㅇ(175.202) 17:44 134 0
482743 일반 진짜 발전속도 존나게 답답하다 ㅋㅋㅋㅋ [9] ㅇㅇ(222.108) 17:32 277 1
482742 일반 오래생각해봤는데 노동 자체가 너무 지성인이 할만한게 아닌듯 [7] ㅇㅇ갤로그로 이동합니다. 17:31 120 2
482741 일반 작년에 올해는 번역쪽만 기대된다고 했는데 [10] 파이어독갤로그로 이동합니다. 17:24 209 1
482740 일반 제미니 프로 1.5한테 유튜브 영상 요약해달라고 해봄 [3] rtOS갤로그로 이동합니다. 17:22 100 0
482739 일반 진짜 특이점 언제 오는거임? [3] ㅇㅇ(222.120) 17:21 95 0
482738 일반 맑스 갈수록 재평가 될 수 있음?? [13] ㅇㅇ(103.237) 17:20 177 2
482737 일반 다양한 언어로 제미니1.5 번역 성능 테스트해봄 [2] ㅇㅇ(220.124) 17:18 100 2
482736 일반 나는 현재 openai 내부 모델 성능이 궁금하다 [5] ㅇㅇ(220.123) 17:14 145 0
482735 일반 5월에 겨울이라니... ㅇㅇ(211.184) 17:14 28 0
482734 일반 2095년은 어떤 모습일거 같음? [7] ㅇㅇ갤로그로 이동합니다. 17:11 102 3
482733 역노화 근데 만약 역노화만 오고... [3] ㅇㅇ갤로그로 이동합니다. 17:10 91 0
482732 일반 와 개씹 겨울이네 [1] ㅇㅇ(121.128) 17:07 83 0
482731 일반 특이점 안오면 급식들은 ㄹㅇ 절망이지 [3] xdxd333갤로그로 이동합니다. 17:06 186 2
482730 일반 2010년대의 발전이 저평가 받는건 어쩔 수 없음 [4] ㅇㅇ(211.184) 17:05 100 1
482729 일반 4o가 진짜 웃기는 모델이긴 하다 ㅇㅇ(59.6) 17:03 97 0
482728 일반 대체 우리 아버지 어머니 세대들은 '논문' 이거 어떻게 쓴거냐? [28] ㅇㅇ(58.29) 16:47 467 9
482727 일반 레커처럼 2029년 agi 믿는애들은 없냐 [9] 연맛갤로그로 이동합니다. 16:43 170 1
482726 일반 전 세계가 언어의 장벽만 극복해도 발전속도 훨씬 빨라질듯 [1] ㅇㅇ갤로그로 이동합니다. 16:41 127 1
482725 일반 갤주는 죽어도 갤주다 [3] ㅇㅇ(114.202) 16:37 98 0
482724 일반 근데 ㄹㅇ 지니가 단일 신경망 말하던 그 지니임? [24] ㅇㅇ(103.237) 16:35 259 0
482723 일반 일단 2012년에 두번째 ai겨울이 끝났는데 [1] ㅇㅇ(114.202) 16:33 114 0
482722 일반 난 ㄹㅇ 스마트폰이 없었으면 어땠을까?하는 생각이 자주 들긴함 [5] ㅇㅇ(103.237) 16:31 115 1
482721 일반 특이점이 진짜 곧 오겠구나 [6] 열심히해보자갤로그로 이동합니다. 16:28 323 0
482720 일반 AI로 쇼츠 만들어서 팔아먹는 애들도 많았구나 [5] 열심히해보자갤로그로 이동합니다. 16:27 242 0
482719 일반 25년에 agi안나오면 일론신뢰도는 사라지는거임 [8] ㅇㅇ(59.11) 16:27 133 0
482718 일반 한문번역 조온나 신기한데 [2] ㅇㅇ(59.19) 16:22 151 0
482717 일반 1924 // 2024 달라진점 [5] ㅇㅇ(59.11) 16:20 145 1
482716 일반 2004년이랑2024년 비교하니까 스마트폰 하나라도 있지 ㅇㅇ(219.254) 16:18 74 0
482715 일반 결국 타고남이 문제네 [1] ㅇㅇ갤로그로 이동합니다. 16:17 78 0
482714 일반 내가 느낀 ChatGPT [2] 야옹이(27.35) 16:17 130 1
482713 일반 자기가 옳은지 남으로 확인하지마라.. [4] ㅇㅇ(59.6) 16:15 120 0
482712 일반 10년대가 겉보기에는 발전속도 떨어져보이긴 하는듯 [4] ㅇㅇ(114.202) 16:13 171 3
482711 일반 글고보니 디시자체도 2010년대랑 바뀐게있긴하네 ㅇㅇ(59.11) 16:08 96 1
482710 일반 2014년이 살기가 더 좋았던거 같음 [17] ㅇㅇ(223.39) 16:04 256 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2