디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] AI 모델에서 "그것"은 데이터셋이다.

ㅇㅇ(61.73) 2024.04.25 12:02:33
조회 1743 추천 24 댓글 7
														

AI 모델에서 "그것"은 데이터셋이다.


2023년 6월 10일 jbetker 작성

저는 거의 1년간 OpenAI에서 근무해 왔습니다. 그 시간 동안 저는 많은 생성 모델을 훈련시켰습니다. 사실상 누구도 그렇게 많이 훈련시킬 권리가 없을 정도로 많이요. 여러 모델 구성과 하이퍼파라미터를 조정하면서 관찰한 시간 동안, 모든 훈련 실행 사이에 유사성이 있다는 것이 점점 뚜렷해졌습니다.


이 모델들이 그들의 데이터셋을 놀랍도록 정교하게 근사화하고 있다는 사실이 점점 분명해지고 있습니다. 이것이 의미하는 바는 그들이 개나 고양이가 무엇인지를 배우는 것뿐만 아니라, 사람들이 자주 찍는 사진이나 흔히 쓰는 단어와 같은 중요하지 않은 분포 사이의 빈도를 배운다는 것입니다.


이는 충분한 가중치와 훈련 시간을 가진 모든 모델들이 같은 데이터셋으로 충분히 오래 훈련되면 거의 모두 동일한 지점으로 수렴한다는 것으로 나타납니다. 충분히 큰 diffusion conv-unets는 ViT 생성기와 동일한 이미지를 생성합니다. AR 샘플링은 diffusion과 동일한 이미지를 생성합니다.


이는 놀라운 관찰입니다! 이것은 모델 행동이 아키텍처, 하이퍼파라미터 또는 최적화 선택에 의해 결정되지 않는다는 것을 의미합니다. 그것은 당신의 데이터셋에 의해 결정됩니다, 그 밖의 다른 것은 없습니다. 다른 모든 것은 그 데이터셋을 효율적으로 근사화하기 위해 계산을 전달하는 수단에 불과합니다.


그러므로 우리가 '람다', '챗GPT', '바드', '클로드'를 언급할 때, 모델 가중치를 언급하는 것이 아닙니다. 그것은 데이터셋을 말하는 것입니다.



The “it” in AI models is the dataset.

Posted on June 10, 2023 by jbetker

I’ve been at OpenAI for almost a year now. In that time, I’ve trained a lot of generative models. More than anyone really has any right to train. As I’ve spent these hours observing the effects of tweaking various model configurations and hyperparameters, one thing that has struck me is the similarities in between all the training runs.


It’s becoming awfully clear to me that these models are truly approximating their datasets to an incredible degree. What that means is not only that they learn what it means to be a dog or a cat, but the interstitial frequencies between distributions that don’t matter, like what photos humans are likely to take or words humans commonly write down.


What this manifests as is – trained on the same dataset for long enough, pretty much every model with enough weights and training time converges to the same point. Sufficiently large diffusion conv-unets produce the same images as ViT generators. AR sampling produces the same images as diffusion.


This is a surprising observation! It implies that model behavior is not determined by architecture, hyperparameters, or optimizer choices. It’s determined by your dataset, nothing else. Everything else is a means to an end in efficiently delivery compute to approximating that dataset.


Then, when you refer to “Lambda”, “ChatGPT”, “Bard”, or “Claude” then, it’s not the model weights that you are referring to. It’s the dataset.



개념글에 올라온 글이 중요한 내용이라고 생각되는데 한글번역이 약간 난해한 부분이 있어서 클로드+GPT4 조합으로 재번역 해 봤다.

https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=459454

 


자동등록방지

추천 비추천

24

고정닉 10

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
463783 일반 지리긴 하네..ㄷㄷ 소설도 뚝딱임 [11] 라익갤로그로 이동합니다. 05.07 3219 17
463742 일반 also gpt2 일단 확실한 거는 [7] ㅇㅇ(125.137) 05.07 3662 15
463666 AI창 재미로 클로드 gpt2 시 만들어보기 [3] 포스트휴먼.갤로그로 이동합니다. 05.07 1530 14
463659 일반 also vs gpt-4 한국어 시 테스트 [28] ㅇㅇ(182.213) 05.07 2668 31
463654 일반 GPT4 원래 이렇게 삐리했나? [13] 월코존버갤로그로 이동합니다. 05.07 2300 20
463649 일반 Also 미쳤는데 ㅋㅋㅋㅋ [1] 헬스토끼갤로그로 이동합니다. 05.07 2983 15
463627 일반 also gpt2 깔끔하네 [1] ㅇㅇ갤로그로 이동합니다. 05.07 2058 14
463603 일반 약간 충격받은 also gpt-2 후기 [12] 컴퓨터비전갤로그로 이동합니다. 05.07 4076 17
463597 일반 also gpt 진짜 미쳤는데? [2] ㅇㅇ갤로그로 이동합니다. 05.07 2480 12
463587 정보 아레나) gpt2, gpt-4, 클로드3 사칙연산 테스트 결과 [10] ㅇㅇ갤로그로 이동합니다. 05.07 2109 16
463584 일반 ㅋㅋGPT2 작문 실력 확실히 늘어나긴했네 [3] 월코존버갤로그로 이동합니다. 05.07 1891 21
463157 정보 올해 말까지 테슬라 옵티머스 DoF 업그레이드 [14] ㅇㅇ(119.77) 05.06 1742 12
463447 정보 마소CTO: OAI 모델, 전작들보다 훨씬 더 강력 등 [11] ㅇㅇ(119.77) 05.07 2059 15
463434 일반 llm 자체가 통계 머신이라 그런거 아니냐 [4] ㅇㅇ(1.223) 05.07 853 20
463302 일반 샘알트만 GPT6까지 미리 계획해놨다는데? [32] ㅇㅇ갤로그로 이동합니다. 05.06 3882 23
463345 일반 Bone Biologics, NB1 임상 프로그램 진행 상황 보고 [5] ㅇㅇ(123.141) 05.06 1105 23
463330 정보 클로드3·GPT-4의 수학 실력은 "암기 아닌 추론" [22] 메타(Meta)갤로그로 이동합니다. 05.06 2723 16
463372 일반 걍 타갤처럼 비추있으면안됨? [23] ㅇㅇ(39.124) 05.06 1535 37
463336 일반 클로드3 오푸스의 수학적 추론능력 [11] ㅇㅇ(58.123) 05.06 1512 21
463321 일반 부패 너무 권한남용 아니냐? [46] ㅇㅇ(61.73) 05.06 2246 39
463154 정보 StoryDiffusion : 일관된 이미지, 코믹스, 비디오 생성 [14] ㅇㅇ­갤로그로 이동합니다. 05.06 2610 25
463112 일반 알트만이 뒤에서 오픈소스팀 방해공작 한다는데 [13] ㅇㅇ갤로그로 이동합니다. 05.05 1582 19
463021 일반 특이점이 반드시 와야만 하는 이유.jpg [67] ㅇㅇ(121.142) 05.05 5048 64
462993 정보 테슬라봇 새로운 영상 [35] ㅇㅇ갤로그로 이동합니다. 05.05 3859 33
462856 일반 한국 과도기 로봇 노동대체 최근일자 모음 [25] ㅇㅇ(110.46) 05.05 3734 45
462779 일반 이 세상이 시뮬레이션이 아닌 이유.ipg [96] ㅇㅇ(114.129) 05.04 5119 25
462748 정보 'AI의 대모'도 AGI 개발 동참...'공간 지능' 스타트업 설립 [11] ㅇㅇ(182.230) 05.04 2461 20
462747 정보 MS, AGI 개발 위해 휴머노이드 로봇 선두 생츄어리 AI와 손잡아 [4] ㅇㅇ(182.230) 05.04 1314 21
462717 일반 30대 샘 X트먼 고객님 H200 GPU 출고 후기 입니다 ㅎㅎ [19] ㅇㅇ­갤로그로 이동합니다. 05.04 3256 37
462710 일반 "야동을 보면 꼬추를 만지고 싶을 것" [14] ㅇㅇ(59.5) 05.04 4589 41
462689 일반 “밥을 안 먹으면 배가 고플 것.” [10] ㅇㅇ갤로그로 이동합니다. 05.04 3485 32
462560 정보 소소하게 화제 중인 '세계 복사' 프로젝트 [26] sam_ultraman갤로그로 이동합니다. 05.03 4424 28
462539 정보 르쿤이햄 : "이제 텍스트 데이터 거의 한계에 도달함" [27] ㅇㅇ(119.77) 05.03 3937 27
462486 정보 '소라'로 제작한 첫 공식 뮤비 공개..."뮤비는 만족할 수준" [30] ㅇㅇ(182.230) 05.03 3111 27
462485 정보 알트먼 "AGI도 수준 차 존재할 것...'AI 킬러 앱'은 에이전트" [4] ㅇㅇ(182.230) 05.03 1772 18
462430 일반 ai노래 유튜브에서 컨텐츠로 자리잡았네 ㅋㅋㅋㅋㅋㅋㅋ [2] 로코무지카갤로그로 이동합니다. 05.03 2503 23
462389 일반 “일론은 Q*가 있다고 진심으로 믿고 움직이고 있다” [14] ㅇㅇ(118.36) 05.03 3849 25
462232 정보 [Official] gpt2-chatbot은 GPT-4.5가 아닙니다. [27] ㅇㅇ(119.77) 05.02 2686 18
462193 정보 공정한 MMLU 벤치마크 결과 [4] ㅇㅇ(119.77) 05.02 604 12
462302 정보 르쿤이형, 누군가를 저격한듯한 발언 [30] ㅇㅇ(119.77) 05.03 3155 30
462294 정보 일리야 수츠케버, 생존신고 [18] ㅇㅇ(119.77) 05.03 2590 21
462270 정보 AI용어) Prompt vs Fine-tuning vs RAG [10] ㅇㅇ(182.230) 05.03 1319 21
461992 정보 샘 알트만 : 2030년에도 삶은 크게 달라지지 않을 것 [69] ㅇㅇ(119.77) 05.02 5748 38
461983 정보 지난주 스탠포드대학교 샘알트만 강연 비디오 [18] ㅇㅇ(125.191) 05.02 2023 21
462055 일반 소신발언) 근데 그냥 gpt-5로 안내면 되는거 아님? [8] ㅇㅇ(1.239) 05.02 2451 21
462054 정보 벤치마크딸 모델들의 민낯 공개 [22] ㅇㅇ(119.77) 05.02 3097 28
461945 일반 스압)노동종말 이후에 찾아올것은 [10] 냉법비법화법갤로그로 이동합니다. 05.02 1638 27
461921 일반 KAN 간략한 정리글 [47] ㅇㅇ(221.152) 05.02 4408 23
461900 일반 KAN이라는 엄청난 것이 떴나본데 [25] ㅇㅇ(106.102) 05.02 3684 21
461743 일반 gpt2의 정체에 대한 추측 (진지글) [12] ㅇㅇ(210.223) 05.01 2869 23
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2