모델 붕괴는 불가피한가? - 선형주의 미니 갤러리

흥한갤 126위

기술적 특이점을 주제로 특이점주의자 선형주의자 모두 손에 손잡고 자유롭게 이야기 나누는곳.

매니저

IIlI(sunhc)

부매니저

ㅇㅇ(091n0fu9…)

개설일

2021-06-22

[정보글] 모델 붕괴는 불가피한가?

ㅇㅇ(125.191) 2024.05.02 11:16:01

조회 51 추천 1 댓글 0

https://arxiv.org/abs/2404.01413

웹 규모 데이터에 대한 사전 훈련과 결합된 생성 모델의 확산은 시기적절한 질문을 제기합니다. 이러한 모델이 자체 생성된 출력에 대해 훈련되면 어떤 일이 발생합니까? 모델-데이터 피드백 루프에 대한 최근 조사에서는 이러한 루프가 모델 붕괴라는 현상으로 이어질 것이라고 제안했습니다. 이 현상에서는 적합한 모델이 쓸모 없게 될 때까지 각 모델-데이터 피드백 반복을 통해 성능이 점진적으로 저하됩니다. 그러나 이러한 연구에서는 주로 시간이 지남에 따라 새로운 데이터가 기존 데이터를 대체한다고 가정했으며, 여기서 더 현실적인 가정은 시간이 지남에 따라 데이터가 축적된다는 것입니다. 본 논문에서는 데이터 축적이 모델 붕괴에 어떤 영향을 미치는지 묻습니다. 우리는 텍스트 말뭉치에 대한 언어 모델 시퀀스를 사전 학습하여 이 질문을 경험적으로 연구합니다. 우리는 원본 실제 데이터를 각 세대의 합성 데이터로 대체하는 것이 실제로 모델 붕괴 경향이 있음을 확인한 다음 원본 실제 데이터와 함께 연속 세대의 합성 데이터를 축적하면 모델 붕괴를 피할 수 있음을 입증합니다. 이러한 결과는 다양한 모델 크기, 아키텍처 및 하이퍼파라미터에 적용됩니다. 우리는 다른 유형의 실제 데이터에 대한 심층 생성 모델(분자 구조 생성을 위한 확산 모델 및 이미지 생성을 위한 변형 자동 인코더)에 대해 유사한 결과를 얻습니다. 데이터를 축적하면 모델 붕괴를 피할 수 있는 이유를 이해하기 위해 일련의 선형 모델이 이전 모델의 출력에 맞는 이전 작업에서 도입된 분석적으로 다루기 쉬운 프레임워크를 사용합니다. 이전 연구에서는 이 프레임워크를 사용하여 데이터가 대체되면 모델 피팅 반복 횟수에 따라 테스트 오류가 증가한다는 것을 보여주었습니다. 우리는 이 주장을 확장하여 데이터가 대신 누적되면 테스트 오류는 반복 횟수와 관계없이 유한한 상한을 가지며, 이는 모델 붕괴가 더 이상 발생하지 않음을 의미합니다.

고정닉 0

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2872	설문	연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은?	운영자	24/06/17	-	-
17223	일반	가속충들 쳐내고 안전하게 갑시다 [1]	ㅇㅇ(211.234)	05.24	79	6
17222	일반	일본 GPT-4o 오디오 데모 [3]	특술람	05.24	121	0
17221	정보글	앤드류응 기조강연 [1]	선갤러(125.191)	05.24	84	0
17220	정보글	앤드류 응 "AGI 수십 년 걸릴 것…위험성 과장돼" [2]	선갤러(125.191)	05.24	125	2
17219	정보글	Lisa Su “AMD 2027년까지 100배의 전력 효율성 향상 목표” [2]	선갤러(125.191)	05.24	85	3
17218	일반	ai가 결국 승자독식의 형태로 흘러갈까 [1]	ㅇㅇ(49.142)	05.24	79	0
17217	일반	사람아니야....ㅜ [1]	락(61.105)	05.24	110	0
17216	정보글	'원조' AI 에이전트 스타트업 어뎁트, 경쟁에 밀려 매각 검토	특술람	05.24	51	0
17215	일반	절대 가속하면안됨 [3]	ㅇㅇ(211.234)	05.24	143	13
17214	일반	특갤에 모자란 애들 왜 이리 많냐 [1]	ㅇㅇ(211.181)	05.24	130	14
17213	일반	OpenAI 신모델 나오면	ㅇㅇ(125.191)	05.24	111	1
17212	정보글	LLM은 반복적인 자기 성찰을 통해 자제력을 배울 수 있습니다.	특술람	05.24	62	0
17211	정보글	구현된 AI에 대한 신경 확장 법칙	ㅇㅇ(125.191)	05.24	59	0
17210	정보글	선호하는 인간 피드백을 통한 다중 회전 강화 학습	ㅇㅇ(125.191)	05.24	50	0
17209	정보글	AndroidWorld: 자율 에이전트를 위한 동적 벤치마킹 환경	ㅇㅇ(125.191)	05.24	63	0
17208	정보글	자연어 액션 및 비디오 상태를 사용한 일반 월드 모델을 향해	ㅇㅇ(125.191)	05.24	53	0
17207	일반	감속충들이 극혐인 이유가	ㅇㅇ(125.191)	05.24	78	1
17206	정보글	얀 르쿤 “초지능 AI 프로젝트 추진”…오픈AI LLM 방식에 한계	ㅇㅇ(125.191)	05.24	85	0
17205	정보글	베프 제조스 인터뷰 요약	ㅇㅇ(125.191)	05.24	76	0
17204	정보글	바이두 CEO "인간만큼 똑똑한 AI, 10년도 더 걸릴 것" [4]	ㅇㅇ(125.191)	05.24	151	2
17203	일반	헐랭 훌라우스 슈밥 세게 정복 포럼 사임한다네여 ㅇㅅㅇ [1]	선갤러(122.36)	05.24	96	1
17202	일반	억시 alt-맨은 다 게획이 잇구나 ㅇㅅㅇ [2]	선갤러(122.36)	05.24	123	0
17201	일반	기득권들이 지구온난화 타령하는 이유 [2]	shuwa	05.24	106	2
17200	일반	특붕의유혹	ㅇㅇ(125.191)	05.24	83	2
17199	정보글	일론머스크 “ai가 우리의 모든 직업을 대신할 것“	ㅇㅇ(125.191)	05.24	110	1
17198	일반	이거 신기하네 ㅋ [1]	선갤러(121.190)	05.24	97	0
17197	일반	유럽이 하니까 일본도 합니다 ㄷㄷ [1]	선갤러(121.190)	05.24	110	1
17196	정보글	일론머스크 "7~8년 안에 화성으로 사람 보낼 것" [1]	선갤러(125.191)	05.24	92	0
17195	정보글	베프 제조스 "세상은 파멸자들에 의해 망해"	선갤러(125.191)	05.24	75	0
17194	정보글	룬붕이 "LLM은 할 수 없을 것이라 주장하는 선형충"	선갤러(125.191)	05.24	78	6
17192	정보글	OpenAI "차세대 모델은 1~2년 안 비교할 수 없을 정도로 발전"	ㅇㅇ(125.191)	05.23	183	11
17191	정보글	레아 미야라와 함께하는 OpenAI, AGI, LLM 평가 및 응용 [1]	ㅇㅇ(125.191)	05.23	109	0
17190	일반	특갤 완장은 분탕들 여론전에 완전히 넘어갔음 [2]	shuwa	05.23	145	0
17189	정보글	‘중국판 뉴럴링크’ 공개…“美 앞서 산업화 가능”	ㅇㅇ(125.191)	05.23	73	0
17188	정보글	인간 뇌 점점 작아진다…지구 온도 상승 여파 [2]	ㅇㅇ(125.191)	05.23	101	1
17187	정보글	냉동인간 실현되나…"냉동 뇌 부활 성공"	ㅇㅇ(125.191)	05.23	71	0
17186	정보글	뉴럴링크 첫 임상시험 좌절...뇌가 움직여 칩 밀어내	ㅇㅇ(125.191)	05.23	64	0
17185	일반	Great Filter의 진정한 이유	ㅇㅇ(125.191)	05.23	100	3
17184	정보글	구글 개인교사 LearnLM 발표	선갤러(125.191)	05.23	86	0
17183	일반	교토대 교수가 말하는 코로나와 백신	shuwa	05.23	76	1
17182	일반	올해 여름에 GPT-4보다 100배 강력한 모델 출시돼야 함 [2]	선갤러(125.191)	05.23	141	0
17181	일반	여기에 어떤 지능이 있다는 거야? [5]	인안나	05.23	170	9
17180	일반	스칼렛 요한슨 관련 건은 규제론자들이 함정에 걸린 느낌인데 [2]	ㅇㅇ(118.235)	05.23	117	3
17179	일반	가속되는건 해고자숫자	ㅇㅇ(172.226)	05.23	70	0
17177	일반	가자지구 아이 ㅇㅅㅇ [3]	선갤러(122.36)	05.23	82	0
17176	일반	이 고대 특슬림이 저랑 의견이 독같네여 ㅇㅅㅇ [4]	선갤러(122.36)	05.23	117	0
17175	일반	gta5 언제 나오나여 ㅇㅅㅇ [3]	선갤러(122.36)	05.23	100	0
17174	정보글	1100억 들인 정부 AI 데이터 사업…관리 부실에 사업비 횡령까지 [2]	ㅇㅇ(125.191)	05.23	87	1
17173	정보글	OpenAI 제품군 [2]	선갤러(125.191)	05.23	113	0
17172	일반	GPU는 가속하셈!! [1]	ㅇㅇ(125.191)	05.23	71	0