디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 손실 관점에서 언어모델의 창발적 능력 이해

ㅇㅇ(125.191) 2024.04.06 21:25:01
조회 350 추천 6 댓글 7
														

29f3c028e2f206a26d81f6e64081736e


29b99e36ebd518986abce89547817768980b


0a97dc20d1ea10a73a9ef78c25e20c73ca220329ad11b5244879cb23deaaa1


0a97dc20d1e021a44b9ef79241c812739b0c0dde77224afb97b9936486311f


https://arxiv.org/abs/2403.15796


최근 연구에서는 언어 모델의 창발 능력이 대형 모델에만 국한된다는 믿음에 의문을 제기했습니다. 이러한 회의론은 두 가지 관찰에서 발생합니다.


1) 작은 모델도 창발 능력에 대해 높은 성능을 나타낼 수 있으며

2) 이러한 능력을 측정하는 데 사용되는 불연속 측정 기준에 대한 의구심이 있습니다.


본 논문에서는 모델 크기나 훈련 계산 대신 사전 훈련 손실의 관점에서 창발 능력을 연구할 것을 제안합니다. 사전 훈련 손실은 동일하지만 모델과 데이터 크기가 다른 모델이 다양한 다운스트림 작업에서 동일한 성능을 생성한다는 것을 보여줍니다. 또한 사전 훈련 손실이 특정 임계값 아래로 떨어지면 모델이 측정 항목의 연속성과 관계없이 특정 작업에 대해 새로운 능력을 나타내는 것을 발견했습니다. 이 임계값에 도달하기 전에는 성능이 무작위 추측 수준으로 유지됩니다. 이는 사전 훈련 손실이 낮은 모델에서 나타나는 능력으로 창발적 능력을 재정의하도록 영감을 주며, 사전 훈련 손실이 더 높은 모델의 성능 추세를 단순히 추정하는 것만으로는 이러한 능력을 예측할 수 없다는 점을 강조합니다.


자동등록방지

추천 비추천

6

고정닉 0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
457246 일반 Gpt 4 turbo mmlu 딴거 실화임? ㅇㅇ(58.140) 04.19 65 0
457245 일반 오픈AI GPT4멸망ㅋㅋㅋㅋ [2] ㅇㅇ(118.38) 04.19 239 0
457244 일반 얀르쿤이 잘만드는건 희소식이 아님. [3] ㅇㅇ갤로그로 이동합니다. 04.19 247 2
457243 일반 70B 성능이 개돌았네 ㄹㅇ.. ㅇㅇ(123.100) 04.19 74 0
457242 일반 라마3 70b는 무검열버프받아서 ㄹㅇ 4급나올거같은데 ㅇㅇ(118.38) 04.19 74 0
457241 일반 근데 4천억 매개변수로 gpt4랑 비빈다는건 딱 gpt4터보급인듯? [3] ㅇㅇ(59.17) 04.19 147 0
457240 일반 400b학습중인데 벌써 4따..잇한거면 ㄹㅇ ㄷㄷㄷ ㅇㅇ(118.38) 04.19 53 0
457239 정보 라마3 405b 모델 올해 말 출시 예정 [1] ㅇㅇ(211.59) 04.19 118 1
457238 일반 llama 3 400b 벤치마크는 아직 초기 성능 [4] ㅇㅇ갤로그로 이동합니다. 04.19 221 6
457236 일반 라마3로 GPT4 따....잇당했네 ㄹㅇ로 ㅋㅋㅋ [1] ㅇㅇ(1.223) 04.19 126 0
457235 일반 2025 AGI!!!! [4] ㅇㅇ(1.239) 04.19 90 0
457233 일반 오픈ai 뭐하냐고!!! [1] ㅇㅇ(210.106) 04.19 78 0
457232 일반 GPT4 초 멸망ㅋㅋㅋㅋ [2] ㅇㅇ(123.100) 04.19 2591 22
457230 일반 라마8b=GPT3.5 라마3 70b GPT3.85급ㄷㄷㄷㄷ ㅇㅇ(1.223) 04.19 65 0
457229 일반 llma 3 400b+도 살짝 공개했네 [1] 람냥갤로그로 이동합니다. 04.19 164 2
457227 정보 라마3 400b 모델 벤치마크 있음 ㄷㄷ [4] ㅇㅇ(211.59) 04.19 207 2
457226 일반 라마3 70b 소넷뛰어넘었노ㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(1.223) 04.19 61 0
457225 정보 저커버그 인터뷰 올라옴 [1] ㅇㅇ(123.100) 04.19 133 2
457224 일반 라마 140b는 GPT4찢는다 무조건ㅋ 70b가 82라니.ㄷㄷㄷ ㅇㅇ(1.223) 04.19 67 0
457223 일반 라마3 70b시발미쳤네 mmlu 82ㅋㅋㅋㅋㅋ [1] ㅇㅇ(1.223) 04.19 125 0
457222 정보 라마3 405b 훈련중 [6] ㅇㅇ(125.191) 04.19 169 2
457220 일반 라마3 아쉬운점 [6] ㅇㅇ(123.100) 04.19 155 0
457218 일반 르쿤이형 믿고있었다고!!! ㅇㅇ(58.140) 04.19 36 0
457216 일반 라마3 기대치는 충족했네 [2] ㅇㅇ(123.100) 04.19 149 0
457215 일반 작년 11월달에 눈밑주름개선 세포치료제 3상 통과했다는데 이거 뭐냐 [3] ㅇㅇ(210.106) 04.19 97 0
457214 일반 사실 역노화 항노화 별거 없긴 함. ㅇㅇ(1.244) 04.19 117 0
457213 정보 라마3 벤치마크 [16] ㅇㅇ(211.59) 04.19 1977 22
457212 일반 네옴시티 꼴 보면... ㅇㅇ(58.140) 04.19 123 1
457211 일반 피겨01 표절? ㅇㅇ(1.244) 04.19 107 0
457210 일반 보스턴 다이나믹스 figure 특허 침해 [8] ㅇㅇ(125.191) 04.19 325 5
457209 일반 소넷이나 잼민이 울트라급으로 기대한다 ㅇㅇ(58.140) 04.19 51 0
457208 일반 역노화가 진지하게 의학에 들어올 수 있음. ㅇㅇ갤로그로 이동합니다. 04.19 103 0
457207 일반 라마3 언제 나오냐 [1] ㅇㅇ(58.140) 04.19 54 0
457206 일반 AI의기억력은 risu 하이퍼메모리키면 장기기억구현가능함 [1] ㅇㅇ(1.223) 04.19 95 0
457205 일반 라마3 내려감 ㅇㅇ ㅇㅇ(218.53) 04.19 123 0
457204 일반 왠 역노화 떡밥임? [2] ㅇㅇ(1.244) 04.19 193 0
457203 일반 전기차보조금 세금아깝다고생각했는데 ㅇㅇ(121.168) 04.19 80 0
457201 일반 특이점 전에 고물가로 굶어죽을듯 ㅇㅇ(1.249) 04.19 64 0
457200 토의 요즘 Ai 메이드 외모.jpg [1] ㅇㅇ(175.194) 04.19 406 2
457199 일반 2027년 강인공지능이 등장하면 특이점은 얼마나 빨라질까? [1] ㅇㅇ(1.239) 04.19 119 1
457198 일반 존버866일차 [8] alphaca갤로그로 이동합니다. 04.19 72 1
457197 일반 역노화 관계자들은 진짜 체포안하냐 [4] ㅇㅇ(223.62) 04.18 261 0
457196 일반 특이점 반대하는 사람들 존나 내로남불인거 같음 ㅇㅇ(124.56) 04.18 89 2
457194 일반 르쿤햄이 유사알트만씹게이새끼들보다 내려쳐지는 거 ㄹㅇ 모름 [2] ㅇㅇ(106.102) 04.18 127 3
457193 일반 빨리 발표해 르쿤형 [1] ㅇㅇ(123.100) 04.18 132 0
457192 일반 비만약 다음 메타는 항노화약이길 [3] ㅇㅇ(210.106) 04.18 138 0
457190 일반 Roon 게이 글삭했노 [4] ㅇㅇ(123.100) 04.18 177 0
457189 일반 메타가 open ai 역할 하는 중 ㅇㅇ(121.128) 04.18 74 0
457187 일반 라마 몇점일까 [2] ㅇㅇ(112.186) 04.18 64 0
457186 일반 우리세대가 경험할 수 있는 특이점은 배터라 혁명이랑 의학 혁명 정도임 [1] ㅇㅇ(118.235) 04.18 87 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2