디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] 모델 붕괴는 불가피한가?

ㅇㅇ(125.191) 2024.05.02 11:16:01
조회 51 추천 1 댓글 0
														

https://arxiv.org/abs/2404.01413


웹 규모 데이터에 대한 사전 훈련과 결합된 생성 모델의 확산은 시기적절한 질문을 제기합니다. 이러한 모델이 자체 생성된 출력에 대해 훈련되면 어떤 일이 발생합니까? 모델-데이터 피드백 루프에 대한 최근 조사에서는 이러한 루프가 모델 붕괴라는 현상으로 이어질 것이라고 제안했습니다. 이 현상에서는 적합한 모델이 쓸모 없게 될 때까지 각 모델-데이터 피드백 반복을 통해 성능이 점진적으로 저하됩니다. 그러나 이러한 연구에서는 주로 시간이 지남에 따라 새로운 데이터가 기존 데이터를 대체한다고 가정했으며, 여기서 더 현실적인 가정은 시간이 지남에 따라 데이터가 축적된다는 것입니다. 본 논문에서는 데이터 축적이 모델 붕괴에 어떤 영향을 미치는지 묻습니다. 우리는 텍스트 말뭉치에 대한 언어 모델 시퀀스를 사전 학습하여 이 질문을 경험적으로 연구합니다. 우리는 원본 실제 데이터를 각 세대의 합성 데이터로 대체하는 것이 실제로 모델 붕괴 경향이 있음을 확인한 다음 원본 실제 데이터와 함께 연속 세대의 합성 데이터를 축적하면 모델 붕괴를 피할 수 있음을 입증합니다. 이러한 결과는 다양한 모델 크기, 아키텍처 및 하이퍼파라미터에 적용됩니다. 우리는 다른 유형의 실제 데이터에 대한 심층 생성 모델(분자 구조 생성을 위한 확산 모델 및 이미지 생성을 위한 변형 자동 인코더)에 대해 유사한 결과를 얻습니다. 데이터를 축적하면 모델 붕괴를 피할 수 있는 이유를 이해하기 위해 일련의 선형 모델이 이전 모델의 출력에 맞는 이전 작업에서 도입된 분석적으로 다루기 쉬운 프레임워크를 사용합니다. 이전 연구에서는 이 프레임워크를 사용하여 데이터가 대체되면 모델 피팅 반복 횟수에 따라 테스트 오류가 증가한다는 것을 보여주었습니다. 우리는 이 주장을 확장하여 데이터가 대신 누적되면 테스트 오류는 반복 횟수와 관계없이 유한한 상한을 가지며, 이는 모델 붕괴가 더 이상 발생하지 않음을 의미합니다.




추천 비추천

1

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
17223 일반 가속충들 쳐내고 안전하게 갑시다 [1] ㅇㅇ(211.234) 05.24 79 6
17222 일반 일본 GPT-4o 오디오 데모 [3] 특술람갤로그로 이동합니다. 05.24 121 0
17221 정보글 앤드류응 기조강연 [1] 선갤러(125.191) 05.24 84 0
17220 정보글 앤드류 응 "AGI 수십 년 걸릴 것…위험성 과장돼" [2] 선갤러(125.191) 05.24 125 2
17219 정보글 Lisa Su “AMD 2027년까지 100배의 전력 효율성 향상 목표” [2] 선갤러(125.191) 05.24 85 3
17218 일반 ai가 결국 승자독식의 형태로 흘러갈까 [1] ㅇㅇ(49.142) 05.24 79 0
17217 일반 사람아니야....ㅜ [1] (61.105) 05.24 110 0
17216 정보글 '원조' AI 에이전트 스타트업 어뎁트, 경쟁에 밀려 매각 검토 특술람갤로그로 이동합니다. 05.24 51 0
17215 일반 절대 가속하면안됨 [3] ㅇㅇ(211.234) 05.24 143 13
17214 일반 특갤에 모자란 애들 왜 이리 많냐 [1] ㅇㅇ(211.181) 05.24 130 14
17213 일반 OpenAI 신모델 나오면 ㅇㅇ(125.191) 05.24 111 1
17212 정보글 LLM은 반복적인 자기 성찰을 통해 자제력을 배울 수 있습니다. 특술람갤로그로 이동합니다. 05.24 62 0
17211 정보글 구현된 AI에 대한 신경 확장 법칙 ㅇㅇ(125.191) 05.24 59 0
17210 정보글 선호하는 인간 피드백을 통한 다중 회전 강화 학습 ㅇㅇ(125.191) 05.24 50 0
17209 정보글 AndroidWorld: 자율 에이전트를 위한 동적 벤치마킹 환경 ㅇㅇ(125.191) 05.24 63 0
17208 정보글 자연어 액션 및 비디오 상태를 사용한 일반 월드 모델을 향해 ㅇㅇ(125.191) 05.24 53 0
17207 일반 감속충들이 극혐인 이유가 ㅇㅇ(125.191) 05.24 78 1
17206 정보글 얀 르쿤 “초지능 AI 프로젝트 추진”…오픈AI LLM 방식에 한계 ㅇㅇ(125.191) 05.24 85 0
17205 정보글 베프 제조스 인터뷰 요약 ㅇㅇ(125.191) 05.24 76 0
17204 정보글 바이두 CEO "인간만큼 똑똑한 AI, 10년도 더 걸릴 것" [4] ㅇㅇ(125.191) 05.24 151 2
17203 일반 헐랭 훌라우스 슈밥 세게 정복 포럼 사임한다네여 ㅇㅅㅇ [1] 선갤러(122.36) 05.24 96 1
17202 일반 억시 alt-맨은 다 게획이 잇구나 ㅇㅅㅇ [2] 선갤러(122.36) 05.24 123 0
17201 일반 기득권들이 지구온난화 타령하는 이유 [2] shuwa갤로그로 이동합니다. 05.24 106 2
17200 일반 특붕의유혹 ㅇㅇ(125.191) 05.24 83 2
17199 정보글 일론머스크 “ai가 우리의 모든 직업을 대신할 것“ ㅇㅇ(125.191) 05.24 110 1
17198 일반 이거 신기하네 ㅋ [1] 선갤러(121.190) 05.24 97 0
17197 일반 유럽이 하니까 일본도 합니다 ㄷㄷ [1] 선갤러(121.190) 05.24 110 1
17196 정보글 일론머스크 "7~8년 안에 화성으로 사람 보낼 것" [1] 선갤러(125.191) 05.24 92 0
17195 정보글 베프 제조스 "세상은 파멸자들에 의해 망해" 선갤러(125.191) 05.24 75 0
17194 정보글 룬붕이 "LLM은 할 수 없을 것이라 주장하는 선형충" 선갤러(125.191) 05.24 78 6
17192 정보글 OpenAI "차세대 모델은 1~2년 안 비교할 수 없을 정도로 발전" ㅇㅇ(125.191) 05.23 183 11
17191 정보글 레아 미야라와 함께하는 OpenAI, AGI, LLM 평가 및 응용 [1] ㅇㅇ(125.191) 05.23 109 0
17190 일반 특갤 완장은 분탕들 여론전에 완전히 넘어갔음 [2] shuwa갤로그로 이동합니다. 05.23 145 0
17189 정보글 ‘중국판 뉴럴링크’ 공개…“美 앞서 산업화 가능” ㅇㅇ(125.191) 05.23 73 0
17188 정보글 인간 뇌 점점 작아진다…지구 온도 상승 여파 [2] ㅇㅇ(125.191) 05.23 101 1
17187 정보글 냉동인간 실현되나…"냉동 뇌 부활 성공" ㅇㅇ(125.191) 05.23 71 0
17186 정보글 뉴럴링크 첫 임상시험 좌절...뇌가 움직여 칩 밀어내 ㅇㅇ(125.191) 05.23 64 0
17185 일반 Great Filter의 진정한 이유 ㅇㅇ(125.191) 05.23 100 3
17184 정보글 구글 개인교사 LearnLM 발표 선갤러(125.191) 05.23 86 0
17183 일반 교토대 교수가 말하는 코로나와 백신 shuwa갤로그로 이동합니다. 05.23 76 1
17182 일반 올해 여름에 GPT-4보다 100배 강력한 모델 출시돼야 함 [2] 선갤러(125.191) 05.23 141 0
17181 일반 여기에 어떤 지능이 있다는 거야? [5] 인안나갤로그로 이동합니다. 05.23 170 9
17180 일반 스칼렛 요한슨 관련 건은 규제론자들이 함정에 걸린 느낌인데 [2] ㅇㅇ(118.235) 05.23 117 3
17179 일반 가속되는건 해고자숫자 ㅇㅇ(172.226) 05.23 70 0
17177 일반 가자지구 아이 ㅇㅅㅇ [3] 선갤러(122.36) 05.23 82 0
17176 일반 이 고대 특슬림이 저랑 의견이 독같네여 ㅇㅅㅇ [4] 선갤러(122.36) 05.23 117 0
17175 일반 gta5 언제 나오나여 ㅇㅅㅇ [3] 선갤러(122.36) 05.23 100 0
17174 정보글 1100억 들인 정부 AI 데이터 사업…관리 부실에 사업비 횡령까지 [2] ㅇㅇ(125.191) 05.23 87 1
17173 정보글 OpenAI 제품군 [2] 선갤러(125.191) 05.23 113 0
17172 일반 GPU는 가속하셈!! [1] ㅇㅇ(125.191) 05.23 71 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2