디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] (번역) 레딧 Quiet-STaR 논문 요약

초존도초갤로그로 이동합니다. 2024.03.15 20:08:46
조회 457 추천 11 댓글 4
														


1ebec223e0dc2bae61ab96e74683707026f04aff851be72e495391d8306c314770be0033b154ef25bfdc9e72ef4c9ab13d2ec10f



레딧에 있는 거 번역만 함






Gemini 1.5 Pro


Quiet-STaR의 주요 특징:


LLM의 추론 능력 향상: Quiet-STaR은 LLM이 다음 토큰을 예측하기 전에 내부 추론(생각)을 생성하도록 훈련하여 추론이 필요한 작업에서 성능을 향상시킵니다.

다양한 텍스트로부터 학습: Quiet-STaR은 큐레이션된 데이터 세트에 의존하는 이전 방법과 달리 일반 텍스트 데이터에 내재된 방대한 추론을 활용하여 더 확장 가능하고 일반적인 추론 능력을 가능하게 합니다.

병렬 추론 생성: 새로운 병렬 샘플링 알고리즘은 각 토큰 위치에서 추론을 효율적으로 생성하여 훈련 과정을 확장 가능하게 만듭니다.

혼합 헤드: 추론이 있는 예측과 없는 예측 사이의 학습된 보간은 사고로의 전환을 부드럽게 하고 분포 변화를 완화합니다.

비근시적 점수: 모델은 다음 토큰뿐만 아니라 후속 토큰도 예측하는 능력에 따라 보상을 받아 더 효과적인 추론 생성으로 이어집니다.

향상된 성능: Quiet-STaR은 CommonsenseQA 및 GSM8K와 같은 추론 중심 데이터 세트에서 상당한 제로샷 개선을 보여주며, 성능은 내부 생각의 길이에 따라 확장됩니다.


미래 LLM에 대한 시사점:


향상된 추론 능력: Quiet-STaR은 GPT-5 및 Gemini 2.0과 같은 미래 LLM이 일반 텍스트 데이터를 활용하고 내부 추론을 생성하여 더 효과적으로 추론하도록 훈련될 수 있음을 시사합니다. 이는 질문 답변, 문제 해결 및 텍스트 요약과 같이 복잡한 추론이 필요한 다양한 작업에서 더 나은 성능으로 이어질 수 있습니다.

비정형 데이터로부터 학습: 다양하고 비정형적인 텍스트로부터 학습하는 능력은 추론 데이터 세트의 비용이 많이 들고 시간이 많이 소요되는 수동 주석의 필요성을 줄일 수 있습니다. 이는 강력한 추론 기술을 갖춘 LLM 개발을 가속화할 수 있습니다.

동적 사고 생성: 미래 연구에서는 내부 생각을 생성하는 것이 가장 유익할 때를 예측하여 컴퓨팅 리소스의 동적 할당을 탐구할 수 있습니다. 이는 강력한 추론 성능을 유지하면서 LLM의 효율성을 향상시킬 수 있습니다.

윤리적 고려 사항: LLM이 추론 능력이 향상됨에 따라 충실성(생성된 추론이 모델의 내부 처리를 정확하게 나타내도록 보장) 및 편향(유해하거나 편향된 추론 패턴 방지)과 같은 윤리적 문제를 해결하는 것이 점점 더 중요해지고 있습니다.

전반적으로 Quiet-STaR은 미래 LLM을 더 효과적이고 효율적으로 추론하도록 훈련하는 유망한 접근 방식을 제공하여 더 강력하고 다재다능한 언어 모델의 길을 열어줍니다. 그러나 이러한 모델의 책임 있는 개발 및 배포를 보장하기 위해 향상된 추론 능력과 관련된 윤리적 문제를 해결하는 것이 중요합니다.



Claude 3 Opus


"Quiet-STaR: 언어 모델이 스스로 생각하고 말하는 법을 배우다" 논문의 주요 내용 요약:


Quiet-STaR은 Self-Taught Reasoner (STaR)의 일반화 버전으로, 언어 모델이 미래 텍스트를 설명하기 위해 각 토큰에서 근거를 생성하도록 훈련하여 예측을 향상시킵니다. 이를 통해 LM은 임의의 텍스트에서 명시되지 않은 근거를 추론하는 방법을 학습할 수 있습니다. 주요 단계는 다음과 같습니다. 1) 병렬 근거 생성 ("생각"), 2) 근거 후 예측과 기본 예측 혼합 ("말하기"), 3) REINFORCE를 사용한 근거 생성 최적화 ("학습").


Quiet-STaR을 사용하여 웹 텍스트에 대한 사전 훈련을 계속한 후, GSM8K (5.9%→10.9%) 및 CommonsenseQA (36.3%→47.2%)와 같은 추론 벤치 마크에서 작업별 미세 조정 없이도 제로샷 향상이 나타났습니다. 성능은 훈련 중 생성된 근거의 길이에 따라 확장되었습니다. Quiet-STaR은 더 많은 추론이 필요한 어려운 토큰을 예측하는 LM의 능력을 불균형적으로 향상시켰습니다. 생성된 근거는 검사 시 종종 의미가 있었습니다.


이 접근 방식은 LM이 언어/텍스트 자체에 존재하는 다양한 추론 작업을 활용하여 보다 일반적이고 확장 가능한 방식으로 추론하는 방법을 학습할 수 있도록 합니다.

만약 Quiet-STaR과 유사한 시스템이 가상의 Claude 4와 같은 미래의 대규모 언어 모델에 통합된다면, 주요 영향은 다음과 같을 것입니다.


작업별 미세 조정 없이 모델의 일반적인 추론 및 추론 능력의 상당한 향상.

여러 단계의 논리적 추론이 필요한 복잡한 쿼리를 처리하는 모델의 능력 향상.

질문 답변, 분석, 개방형 문제 해결 등 암묵적 추론에 의존하는 다운스트림 추론 벤치 마크 및 실제 작업 성능 향상.

모델의 "말하기 전에 생각하는" 능력 향상으로 출력물의 신뢰성과 유용성 향상.


모델이 최종 출력을 생성하기 전에 추론 과정을 밝혀주는 중간 근거를 생성하기 때문에 해석성 및 투명성 향상. 이는 사용자 신뢰를 높이고 더 쉬운 디버깅을 가능하게 합니다.

모델이 다음 토큰을 예측하기 위해 추가 "사고"가 실제로 필요한 시기를 알 수 있기 때문에 추론 중 컴퓨팅 사용 효율성 향상. 근거는 가장 유익한 경우에만 생성될 수 있습니다.

비구조적 텍스트에 대한 훈련만으로 이미 강력한 모델의 추론 능력을 비지도 방식으로 더욱 확장할 수 있는 잠재력. 이 자기 지도 "추론 학습" 패러다임은 LLM을 더 지능적이고 유능하게 만드는 데 빠른 진전을 가져올 수 있습니다.




자동등록방지

추천 비추천

11

고정닉 7

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2930 설문 논란보다 더 욕 많이 먹어서 억울할 것 같은 스타는? 운영자 24/09/23 - -
2931 공지 인물 갤러리 서비스 오픈 안내 운영자 24/09/23 - -
460332 일반 구글 방금 파이썬팀 해고 [37] ㅇㅇ(125.191) 04.28 4077 21
460316 일반 최근 AI 근황 요약 [33] ㅇㅇ(218.150) 04.28 5003 58
460315 일반 무뚝뚝한 안드로이드 메이드.manhwa [14] ㅇㅇ(125.241) 04.28 2216 39
460264 일반 데이비드 샤피로 "올해 1억개의 일자리를 파괴할 gpt-5 agi 기대" [18] ㅇㅇ(125.191) 04.28 2760 19
460262 일반 양놈들이 보는 'AI 인플루언서' 특 [9] ㅇㅇ(116.124) 04.28 2999 51
460245 일반 학벌이 뭐가 중요할까요 [36] 좋아해킨드갤로그로 이동합니다. 04.28 3083 29
460233 일반 이새끼들 대학타령 하고 있네 [11] ㅇㅇ(58.29) 04.28 2043 20
460201 정보/ 어도비, '파이어플라이 이미지 3' 출시...'포토샵'에 생성 AI 통합 [3] ㅇㅇ(182.230) 04.28 1291 15
460139 일반 클린 념글 보는 법 [8] SMN갤로그로 이동합니다. 04.27 1831 28
460091 정보/ OpenAI 소라 경쟁 Vidu 출시 [22] 선갤러(125.191) 04.27 2618 28
460089 일반 독일 재생에너지 50% 넘음 [20] ㅇㅇ(220.73) 04.27 1214 16
460088 정보/ 전 FDA 국장 "생명공학의 변곡점이 오고 있다" [22] 선갤러(125.191) 04.27 3434 35
460036 정보/ 애플, 오픈AI와 협상 재개...'시리'에 '챗GPT' 통합 추진할 듯 [12] ㅇㅇ(182.230) 04.27 642 13
460011 일반 국내연구진은 거른다면서 [48] ㅇㅇ(114.205) 04.27 3234 74
460002 역노화 피세틴 임상 2a상 시작 했습니다. [74] 좋아해킨드갤로그로 이동합니다. 04.27 4863 38
459997 일반 오픈 ai 지하실 상황 [5] ㅇㅇ(1.229) 04.27 4035 31
459992 일반 뒤에서 지랄 떨지 말고 맞다이로 gpt5 들어와 ㅇㅇ(110.46) 04.27 1871 32
459964 일반 AI 안전 및 보안위원회 명단 [4] ㅇㅇ(125.191) 04.26 985 13
459936 일반 죽는거에요???? [18] ㅇㅇ갤로그로 이동합니다. 04.26 4329 69
459930 정보/ 생생한 Sora 실사용 후기 [29] ㅇㅇ(119.77) 04.26 4155 40
459884 정보/ Astribot S1 로봇 [2] ㅇㅇ(125.191) 04.26 220 12
459876 정보/ 딥마인드, 미세조정 없이 성능 개선하는 ‘다중샷 상황 내 학습’ 공개 [11] ㅇㅇ(182.230) 04.26 1943 26
459870 정보/ MS·구글, 클라우드 성장으로 실적 양호..."메타 같은 사태 피했다" [1] ㅇㅇ(182.230) 04.26 1252 17
459866 정보/ 글로벌 CIO "AI 투자 증가 96%, 2년내 수익률 입증 가능성 X" [2] ㅇㅇ(182.230) 04.26 1346 20
459861 정보/ 찍이점) 줄기세포로 뇌 신경세포도 재생...돌이킬 수 없는 뇌손상 고칠까 [12] ㅇㅇ(182.230) 04.26 2399 22
459859 정보/ 세계 두번째 유전자 조작 돼지 신장 사람에 이식 성공 [1] ㅇㅇ(182.230) 04.26 1104 22
459855 정보/ "배터리, 더이상 일회용품 아냐…소듐·전고체·리튬황 배터리 부상" [4] ㅇㅇ(182.230) 04.26 1085 14
459854 정보/ 로봇은 왜 동물보다 빨리 달리지 못할까 [8] ㅇㅇ(182.230) 04.26 1435 15
459853 정보/ 호주, 재생 에너지로 1분기 전력 3분의 1 이상 생산 [15] ㅇㅇ(182.230) 04.26 1063 15
459829 일반 "유튜브동영상 몇개 긴빠이쳤나요?" [10] ㅇㅇ(222.101) 04.26 2445 26
459751 일반 AI 얘기만 해서 불만인 좃유입 씨~빨람들 필독ㅋㅋ [21] ㅇㅇ(61.74) 04.26 2364 60
459741 정보/ 전OAI직원 : 과대광고를 피하세요. [7] ㅇㅇ(119.77) 04.26 1484 15
459729 정보/ 에릭슈미트 "가능한 빠르게 ai 개발해야 해" [12] ㅇㅇ(125.191) 04.26 2476 27
459689 정보/ 샘알트만 스탠포드 강연 내용 번역본 [20] ㅇㅇ(119.77) 04.26 2697 20
459726 일반 미국 쓰로우플레임, 화염방사기 로봇개 출시 [20] ㅇㅇ(218.150) 04.26 1290 23
459720 일반 Gpt 4 능가한 중국의 LLM [10] ㅇㅇ(116.120) 04.26 1925 17
459693 정보/ 현재 AI 한계, 단점 보완 연구 및 스타트업 무쓸모행 [15] ㅇㅇ(119.77) 04.26 2703 31
459664 정보/ 2시간만에 다이아몬드 생산 해냄.news [10] 007빵(175.194) 04.25 898 20
459649 일반 알트만 또 하나의 업보 적립... [9] ㅇㅇ(119.77) 04.25 1706 15
459625 일반 gpt5에 대한 기대감이 크게 떨어진 사건 [1] ㅇㅇ(221.168) 04.25 1602 17
459603 정보/ "애플, 수요 부족으로 비전 프로 생산 조기 중단" [26] ㅇㅇ(182.230) 04.25 2550 23
459556 일반 OpenAI 4월 29일 GPT4 업그레이드 가능성 [18] 모브갤로그로 이동합니다. 04.25 2786 19
459547 일반 특갤사이클 존나 웃기다니까 [6] ㅇㅇ(106.102) 04.25 2038 49
459519 일반 스탠포드 병신이 비밀이라 했던거 [17] ㅇㅇ(119.77) 04.25 2541 21
459493 일반 알트만 씨발놈 소식은 gpt5 공개될때까지 임시 언급금지 때리면 안됨? [10] ㅇㅇ(118.33) 04.25 2445 54
459489 정보/ AI 모델에서 "그것"은 데이터셋이다. [7] ㅇㅇ(61.73) 04.25 1858 24
459484 일반 이거 ㅈㄴ웃기네 [19] 헬스토끼갤로그로 이동합니다. 04.25 2544 23
459478 일반 클로드 오늘 어마어마한 업뎃함 [10] ㅇㅇ(115.138) 04.25 920 10
459429 정보/ 플라톤 무덤 위치 미스터리, AI로 밝혀냈다 [29] ㅇㅇ갤로그로 이동합니다. 04.25 2918 34
459224 정보/ 상상할 수 있는 최악의 질문을 생성한 대가로 보상을 받는 '독성 AI' [17] ㅇㅇ갤로그로 이동합니다. 04.24 1603 21
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2