디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 압축은 지능을 선형적으로 나타냅니다.모바일에서 작성

특술람갤로그로 이동합니다. 2024.04.16 12:23:57
조회 705 추천 23 댓글 4
														
7ced8076b5836af73be998bf06d60403997aa2a78d4c80441ce0

7ced8076b5836af73be898bf06d60403e299993e90420f956f8b


https://github.com/hkust-nlp/llm-compression-intelligence

 



https://arxiv.org/abs/2404.09937

 

Compression Represents Intelligence Linearly

There is a belief that learning to compress well will lead to intelligence. Recently, language modeling has been shown to be equivalent to compression, which offers a compelling rationale for the success of large language models (LLMs): the development of more advanced language models is essentially enhancing compression which facilitates intelligence. Despite such appealing discussions, little empirical evidence is present for the interplay between compression and intelligence. In this work, we examine their relationship in the context of LLMs, treating LLMs as data compressors. Given the abstract concept of "intelligence", we adopt the average downstream benchmark scores as a surrogate, specifically targeting intelligence related to knowledge and commonsense, coding, and mathematical reasoning. Across 12 benchmarks, our study brings together 30 public LLMs that originate from diverse organizations. Remarkably, we find that LLMs' intelligence -- reflected by average benchmark scores -- almost linearly correlates with their ability to compress external text corpora. These results provide concrete evidence supporting the belief that superior compression indicates greater intelligence. Furthermore, our findings suggest that compression efficiency, as an unsupervised metric derived from raw text corpora, serves as a reliable evaluation measure that is linearly associated with the model capabilities. We open-source our compression datasets as well as our data collection pipelines to facilitate future researchers to assess compression properly.

arxiv.org



잘 압축하는 법을 배우면 지능이 높아진다는 믿음이 있습니다. 최근 언어 모델링은 압축과 동등한 것으로 나타났으며 이는 LLM(대형 언어 모델)의 성공에 대한 설득력 있는 근거를 제공합니다. 고급 언어 모델의 개발은 본질적으로 지능을 촉진하는 압축을 향상시킵니다. 이러한 매력적인 논의에도 불구하고 압축과 지능 간의 상호 작용에 대한 경험적 증거는 거의 없습니다. 이 작업에서는 LLM을 데이터 압축기로 취급하여 LLM의 맥락에서 이들의 관계를 조사합니다. "지능"이라는 추상적인 개념을 고려하여 우리는 평균 다운스트림 벤치마크 점수를 대리자로 채택하고 특히 지식 및 상식, 코딩 및 수학적 추론과 관련된 지능을 대상으로 합니다. 12가지 벤치마크를 통해 우리 연구에서는 다양한 조직에서 나온 30개의 공개 LLM을 통합했습니다. 놀랍게도 평균 벤치마크 점수에 반영된 LLM의 지능은 외부 텍스트 말뭉치를 압축하는 능력과 거의 선형적으로 연관되어 있습니다. 이러한 결과는 뛰어난 압축률이 더 뛰어난 지능을 의미한다는 믿음을 뒷받침하는 구체적인 증거를 제공합니다. 또한, 우리의 연구 결과는 원시 텍스트 말뭉치에서 파생된 비지도 측정 지표인 압축 효율성이 모델 기능과 선형적으로 연관된 신뢰할 수 있는 평가 척도 역할을 한다는 것을 시사합니다. 우리는 미래의 연구자들이 압축을 적절하게 평가할 수 있도록 압축 데이터 세트와 데이터 수집 파이프라인을 오픈 소스로 제공합니다.
자동등록방지

추천 비추천

23

고정닉 6

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
473418 일반 이미지는 좀 끌리는데 ㅇㅇ(222.234) 05.15 43 0
473417 일반 gpt4o 비디오 안된다는 애들은 뭐냐 ㅋㅋ [8] ㅇㅇ(119.77) 05.15 259 4
473416 일반 흑인 히틀러 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 28 0
473415 일반 ㅅㅂ 구글 글래스 실제로 써 본 사람으로서 말함 [7] ㅇㅇ(218.39) 05.15 199 2
473414 일반 생성형 무슨 뭐 입갤 ㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 24 0
473413 일반 애들이 다 왜 억지로 하는거 같냐 Spark갤로그로 이동합니다. 05.15 38 0
473412 일반 시연을 안하면 믿을 수가 있어야지 ㅇㅇ(112.156) 05.15 28 0
473411 일반 딥마인드 본체어디가고 웬 늙은 얀르쿤 ㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 41 0
473410 일반 비디오 궁금하네 ㅇㅇ갤로그로 이동합니다. 05.15 15 0
473407 일반 그냥 안경에 4o넣는게 더 이득아님? [2] ㅇㅋ갤로그로 이동합니다. 05.15 117 0
473406 일반 녹화영상만 보여주지 말고 시연 라이브로 하면 ㅇㅈ한다 ㅇㅇ [1] ㅇㅇ(112.156) 05.15 64 0
473405 일반 하드웨어 기업의 강점이 여기 있는 거임 ㅇㅇ(222.116) 05.15 60 0
473404 일반 아니 씨발아 시연 어디갔냐고 ㅇㅇ갤로그로 이동합니다. 05.15 31 0
473403 일반 이번에는 사기치는거 아니겠지?? 이세이미야케갤로그로 이동합니다. 05.15 21 0
473402 일반 이걸 라이브로 보여줬어야지 ㅅㅂ ㅇㅇ(211.214) 05.15 27 0
473400 일반 Later this year ㅋㅋㅋㅋㅋㅋ 멸망 [4] ㅇㅇ(211.36) 05.15 107 2
473399 일반 라이브도 아니고 녹화본인데도 어째 더 하위호환같냐 ... FIREKICK갤로그로 이동합니다. 05.15 38 2
473398 일반 구글에 OAI 산업 스파이 있는 게 확실한 듯 [3] TS망상갤로그로 이동합니다. 05.15 133 0
473397 일반 글라스 온 버젼!!!!!!!!!!!!!!! ㅂㄷ(119.70) 05.15 86 0
473396 일반 하사비스 안경 바로 그거노??? ㅇㅇ갤로그로 이동합니다. 05.15 23 0
473395 일반 원모어띵 하나만 하고가요 하사비스 ㅇㅇ ㅇㅇ갤로그로 이동합니다. 05.15 19 0
473394 일반 그래서 예전에 사기친거 이번엔 진짜하는거지?? ㅇㅇ(106.101) 05.15 23 0
473393 일반 안경이 본체였너 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(220.116) 05.15 34 0
473392 일반 실시간 영상처리 개쩌는거 맞음 ㅇㅇ ㅇㅇ갤로그로 이동합니다. 05.15 68 0
473391 일반 솔직히 편집빨아님??? ㅋㅋㅋㅋㅋㅋ ㅇㅇ(121.162) 05.15 25 0
473390 일반 저거 안드에 넣어준다 이거지? [1] ㅇㅇ(218.232) 05.15 40 0
473389 일반 이거 라이브 아닌거 좀 짜치는데 [1] ㅇㅇ(222.234) 05.15 77 0
473388 일반 슈뢰딩거는 지렸는데? ㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 42 0
473387 일반 좋아보이면 개추 ㅇㅇ갤로그로 이동합니다. 05.15 19 0
473386 일반 시연 해야겠지????? ㅇㅇ갤로그로 이동합니다. 05.15 17 0
473385 일반 커여운 댕댕이 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 19 0
473384 일반 구글 글래스 개같이 부활!! ㅇㅇ(112.151) 05.15 25 0
473383 일반 ㅁㅊ 글래스랑 연동은 ㅈ되는데? ㅇㅇ갤로그로 이동합니다. 05.15 32 0
473382 일반 애미나이 왜케 힘이 없냐.. ㄷㄷ(59.24) 05.15 27 0
473381 일반 비전프로 따-잇입갤ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(218.153) 05.15 84 0
473380 일반 오픈AI는 구글이 뭘 발표할지 다 알고 있었네 [1] ㅇㅇ(115.41) 05.15 132 2
473379 일반 슈뢰딩거스 캣 입갤 ㅋㅋㅋㅋㅋ ㅇㅇ(125.240) 05.15 23 0
473378 일반 그래서 1.5울트라는? 2.0은? ㅇㅇ(119.77) 05.15 23 0
473377 일반 구글 글라스 개같이 부활 ㅋㅋㅋㅋ TS망상갤로그로 이동합니다. 05.15 42 0
473376 일반 구글비전ㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 19 0
473375 일반 구글 글래스...???? 퐁칸8갤로그로 이동합니다. 05.15 32 0
473374 일반 흠 나쁘진 않은데 경쟁자가 안좋았네 ㅇㅋ갤로그로 이동합니다. 05.15 28 0
473373 일반 라이브가 아닌게 수상한데... ㅇㅇ(112.156) 05.15 34 1
473372 일반 개씨발좆되게뒤집어지는 글래스 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 32 0
473371 일반 하드웨어 입갤 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 11 0
473370 일반 구글글래스 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(218.153) 05.15 82 0
473369 일반 저건 좀 지리는데 ㅋㅋ ㅇㅇ(49.246) 05.15 18 0
473366 일반 안경?????? 이세이미야케갤로그로 이동합니다. 05.15 17 0
473365 일반 안경ㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 16 0
473364 일반 화살표 존나 그려보고 싶으면 개추 ㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 20 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2