디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 손실 관점에서 언어모델의 창발적 능력 이해

ㅇㅇ(125.191) 2024.04.06 21:25:01
조회 353 추천 6 댓글 7
														

29f3c028e2f206a26d81f6e64081736e


29b99e36ebd518986abce89547817768980b


0a97dc20d1ea10a73a9ef78c25e20c73ca220329ad11b5244879cb23deaaa1


0a97dc20d1e021a44b9ef79241c812739b0c0dde77224afb97b9936486311f


https://arxiv.org/abs/2403.15796


최근 연구에서는 언어 모델의 창발 능력이 대형 모델에만 국한된다는 믿음에 의문을 제기했습니다. 이러한 회의론은 두 가지 관찰에서 발생합니다.


1) 작은 모델도 창발 능력에 대해 높은 성능을 나타낼 수 있으며

2) 이러한 능력을 측정하는 데 사용되는 불연속 측정 기준에 대한 의구심이 있습니다.


본 논문에서는 모델 크기나 훈련 계산 대신 사전 훈련 손실의 관점에서 창발 능력을 연구할 것을 제안합니다. 사전 훈련 손실은 동일하지만 모델과 데이터 크기가 다른 모델이 다양한 다운스트림 작업에서 동일한 성능을 생성한다는 것을 보여줍니다. 또한 사전 훈련 손실이 특정 임계값 아래로 떨어지면 모델이 측정 항목의 연속성과 관계없이 특정 작업에 대해 새로운 능력을 나타내는 것을 발견했습니다. 이 임계값에 도달하기 전에는 성능이 무작위 추측 수준으로 유지됩니다. 이는 사전 훈련 손실이 낮은 모델에서 나타나는 능력으로 창발적 능력을 재정의하도록 영감을 주며, 사전 훈련 손실이 더 높은 모델의 성능 추세를 단순히 추정하는 것만으로는 이러한 능력을 예측할 수 없다는 점을 강조합니다.


자동등록방지

추천 비추천

6

고정닉 0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
468987 일반 ㅅㅅㅅㅅㅅㄱㄱㄱㅅㅅㅅㅅ사만다!!!!! ㅇㅇ(110.46) 05.14 24 0
468986 일반 속도 씨발 ㅋㅋㅋ 걍 자비스잖아 저걸 무료로 푼다고? ㅇㅇ(58.127) 05.14 65 0
468985 일반 ㅆㅂ 싸만다 맞네 ㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(218.153) 05.14 38 0
468984 일반 음성 심심이 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(175.116) 05.14 20 0
468983 일반 많이 빠르긴 하네 타비타비갤로그로 이동합니다. 05.14 16 0
468982 일반 속도 뭐야?? 어투 뭐야?? ㅇㅇ(121.128) 05.14 32 0
468981 일반 어 시발 이거 진짜 her오는거냐? ㅇㅇ(211.230) 05.14 32 0
468980 일반 사만다 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(211.46) 05.14 19 0
468979 일반 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.14 8 0
468977 일반 존나빠르네 ㅇㅇ(112.186) 05.14 15 0
468976 일반 오픈끼얏호우~~~~! ㅇㅇ(1.243) 05.14 12 0
468975 일반 사만다 목소리 ㄷㄷㄷㄷㄷㄷ 초존도초갤로그로 이동합니다. 05.14 30 0
468974 일반 올려라 시발 ㅇㅇ(58.29) 05.14 50 0
468973 일반 와 개빨라 미친년 ㄷㄷㄷㄷ ㅇㅇ(121.124) 05.14 26 0
468972 일반 마소 시총 15조 증발 ㅋㅋ [2] ㅇㅇ(58.231) 05.14 172 0
468971 일반 오 빠른데? 특이점 왔냐? ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.14 17 0
468969 일반 음? ㅁㄱㅌㅊ(39.122) 05.14 12 0
468968 일반 사만다 떳는데? 시발 ㅈ댄다 fwaf(14.50) 05.14 29 0
468967 일반 와 개빠른데??? 이세이미야케갤로그로 이동합니다. 05.14 17 0
468966 일반 ????? 속도 뭐임? 미쳤는데? ㅇㅇ(121.191) 05.14 28 0
468965 일반 싸만다 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(218.153) 05.14 20 0
468964 일반 씨이ㅣㅣㅣㅣㅣㅣㅣㅣㅣㅣㅣㅣ발 자비스입갤ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(112.153) 05.14 18 0
468963 일반 사만다 입갤 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(59.31) 05.14 26 0
468962 일반 HER 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(121.162) 05.14 30 0
468961 일반 her 입갤 ㅇㅇ(220.65) 05.14 15 0
468960 일반 오 빠른데? ㅇㅇ(211.230) 05.14 16 0
468959 일반 와씨발 존나 빠르긴 하네 ㅇㅇ갤로그로 이동합니다. 05.14 24 0
468958 일반 ㄷㄷ her 떳다 시발 ㅋㅋㅋㅋㅋㅋ fwaf(14.50) 05.14 30 0
468957 일반 agi 없이 llm장사로 10년 더해먹을듯 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(218.153) 05.14 25 0
468956 일반 음성이 맞았노 씨발 ㅋㅋㅋㅋㅋㅋ 비닌갤로그로 이동합니다. 05.14 63 0
468955 일반 저게 전부냐? 저게 끝? ㅇㅇ갤로그로 이동합니다. 05.14 20 0
468954 일반 내일도 노동하러 가야해서 자야되면 개추 TS망상갤로그로 이동합니다. 05.14 14 0
468953 일반 실시간 대화 ㄷㄷㄷㄷㄷ ㅇㅇ(218.232) 05.14 32 0
468952 일반 할인 = 똥꼬쇼 ㅇㅇ(121.131) 05.14 35 0
468951 일반 오 뭔가 나온다 ㅇㅇ(121.128) 05.14 18 0
468950 일반 디아블로 개봉식 같노 자애갤로그로 이동합니다. 05.14 10 0
468949 일반 어? ㅇㅇ(58.226) 05.14 21 0
468948 일반 워후우우~~~~!!! 박수 짝짝짝!!!!!!!! ㅇㅇ(58.29) 05.14 12 0
468947 일반 개씨발뒤집어지는 스피드 ㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.14 42 0
468946 일반 그래서 추론능력 향상 얼마나 됐는데 [1] 나일론마스크갤로그로 이동합니다. 05.14 35 0
468945 일반 마크 칭챙 등장 ㄷㄷㄷ ㅇㅇ(211.46) 05.14 19 0
468944 일반 알트먼은 안나오냐 ㅇㅇ(115.139) 05.14 10 0
468942 정보 also gpt 벤치마크 공개 [3] ㅇㅇ­갤로그로 이동합니다. 05.14 231 3
468941 일반 메인디쉬 나왔다 데모 초존도초갤로그로 이동합니다. 05.14 22 0
468940 일반 동양인 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(121.162) 05.14 19 0
468939 일반 병신 2마리 입갤 ㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.14 22 0
468938 일반 오늘 요약 gpt4비전2.0 무료화 ㅇㅇ갤로그로 이동합니다. 05.14 72 0
468937 일반 GPT4o = also ㅆㅂ 확정이네 ㅋㅋㅋ ㅇㅇ(119.77) 05.14 74 0
468936 일반 하여간 특갤 애들 근들갑은 ㅋㅋㅋ ㅇㅇ(121.191) 05.14 17 0
468935 일반 씨발 박수치지말라고 ㅋㅋㅋㅋㅋㅋㅋ 비닌갤로그로 이동합니다. 05.14 37 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2