(번역) 레딧 Quiet-STaR 논문 요약 - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…) VPN차단용(near1254) ㅇㅇ(prince23…)

개설일

2019-08-01

[정보/뉴스] (번역) 레딧 Quiet-STaR 논문 요약

초존도초

2024.03.15 20:08:46

조회 457 추천 11 댓글 4

1ebec223e0dc2bae61ab96e74683707026f04aff851be72e495391d8306c314770be0033b154ef25bfdc9e72ef4c9ab13d2ec10f

레딧에 있는 거 번역만 함

Gemini 1.5 Pro

Quiet-STaR의 주요 특징:

LLM의 추론 능력 향상: Quiet-STaR은 LLM이 다음 토큰을 예측하기 전에 내부 추론(생각)을 생성하도록 훈련하여 추론이 필요한 작업에서 성능을 향상시킵니다.

다양한 텍스트로부터 학습: Quiet-STaR은 큐레이션된 데이터 세트에 의존하는 이전 방법과 달리 일반 텍스트 데이터에 내재된 방대한 추론을 활용하여 더 확장 가능하고 일반적인 추론 능력을 가능하게 합니다.

병렬 추론 생성: 새로운 병렬 샘플링 알고리즘은 각 토큰 위치에서 추론을 효율적으로 생성하여 훈련 과정을 확장 가능하게 만듭니다.

혼합 헤드: 추론이 있는 예측과 없는 예측 사이의 학습된 보간은 사고로의 전환을 부드럽게 하고 분포 변화를 완화합니다.

비근시적 점수: 모델은 다음 토큰뿐만 아니라 후속 토큰도 예측하는 능력에 따라 보상을 받아 더 효과적인 추론 생성으로 이어집니다.

향상된 성능: Quiet-STaR은 CommonsenseQA 및 GSM8K와 같은 추론 중심 데이터 세트에서 상당한 제로샷 개선을 보여주며, 성능은 내부 생각의 길이에 따라 확장됩니다.

미래 LLM에 대한 시사점:

향상된 추론 능력: Quiet-STaR은 GPT-5 및 Gemini 2.0과 같은 미래 LLM이 일반 텍스트 데이터를 활용하고 내부 추론을 생성하여 더 효과적으로 추론하도록 훈련될 수 있음을 시사합니다. 이는 질문 답변, 문제 해결 및 텍스트 요약과 같이 복잡한 추론이 필요한 다양한 작업에서 더 나은 성능으로 이어질 수 있습니다.

비정형 데이터로부터 학습: 다양하고 비정형적인 텍스트로부터 학습하는 능력은 추론 데이터 세트의 비용이 많이 들고 시간이 많이 소요되는 수동 주석의 필요성을 줄일 수 있습니다. 이는 강력한 추론 기술을 갖춘 LLM 개발을 가속화할 수 있습니다.

동적 사고 생성: 미래 연구에서는 내부 생각을 생성하는 것이 가장 유익할 때를 예측하여 컴퓨팅 리소스의 동적 할당을 탐구할 수 있습니다. 이는 강력한 추론 성능을 유지하면서 LLM의 효율성을 향상시킬 수 있습니다.

윤리적 고려 사항: LLM이 추론 능력이 향상됨에 따라 충실성(생성된 추론이 모델의 내부 처리를 정확하게 나타내도록 보장) 및 편향(유해하거나 편향된 추론 패턴 방지)과 같은 윤리적 문제를 해결하는 것이 점점 더 중요해지고 있습니다.

전반적으로 Quiet-STaR은 미래 LLM을 더 효과적이고 효율적으로 추론하도록 훈련하는 유망한 접근 방식을 제공하여 더 강력하고 다재다능한 언어 모델의 길을 열어줍니다. 그러나 이러한 모델의 책임 있는 개발 및 배포를 보장하기 위해 향상된 추론 능력과 관련된 윤리적 문제를 해결하는 것이 중요합니다.

Claude 3 Opus

"Quiet-STaR: 언어 모델이 스스로 생각하고 말하는 법을 배우다" 논문의 주요 내용 요약:

Quiet-STaR은 Self-Taught Reasoner (STaR)의 일반화 버전으로, 언어 모델이 미래 텍스트를 설명하기 위해 각 토큰에서 근거를 생성하도록 훈련하여 예측을 향상시킵니다. 이를 통해 LM은 임의의 텍스트에서 명시되지 않은 근거를 추론하는 방법을 학습할 수 있습니다. 주요 단계는 다음과 같습니다. 1) 병렬 근거 생성 ("생각"), 2) 근거 후 예측과 기본 예측 혼합 ("말하기"), 3) REINFORCE를 사용한 근거 생성 최적화 ("학습").

Quiet-STaR을 사용하여 웹 텍스트에 대한 사전 훈련을 계속한 후, GSM8K (5.9%→10.9%) 및 CommonsenseQA (36.3%→47.2%)와 같은 추론 벤치 마크에서 작업별 미세 조정 없이도 제로샷 향상이 나타났습니다. 성능은 훈련 중 생성된 근거의 길이에 따라 확장되었습니다. Quiet-STaR은 더 많은 추론이 필요한 어려운 토큰을 예측하는 LM의 능력을 불균형적으로 향상시켰습니다. 생성된 근거는 검사 시 종종 의미가 있었습니다.

이 접근 방식은 LM이 언어/텍스트 자체에 존재하는 다양한 추론 작업을 활용하여 보다 일반적이고 확장 가능한 방식으로 추론하는 방법을 학습할 수 있도록 합니다.

만약 Quiet-STaR과 유사한 시스템이 가상의 Claude 4와 같은 미래의 대규모 언어 모델에 통합된다면, 주요 영향은 다음과 같을 것입니다.

작업별 미세 조정 없이 모델의 일반적인 추론 및 추론 능력의 상당한 향상.

여러 단계의 논리적 추론이 필요한 복잡한 쿼리를 처리하는 모델의 능력 향상.

질문 답변, 분석, 개방형 문제 해결 등 암묵적 추론에 의존하는 다운스트림 추론 벤치 마크 및 실제 작업 성능 향상.

모델의 "말하기 전에 생각하는" 능력 향상으로 출력물의 신뢰성과 유용성 향상.

모델이 최종 출력을 생성하기 전에 추론 과정을 밝혀주는 중간 근거를 생성하기 때문에 해석성 및 투명성 향상. 이는 사용자 신뢰를 높이고 더 쉬운 디버깅을 가능하게 합니다.

모델이 다음 토큰을 예측하기 위해 추가 "사고"가 실제로 필요한 시기를 알 수 있기 때문에 추론 중 컴퓨팅 사용 효율성 향상. 근거는 가장 유익한 경우에만 생성될 수 있습니다.

비구조적 텍스트에 대한 훈련만으로 이미 강력한 모델의 추론 능력을 비지도 방식으로 더욱 확장할 수 있는 잠재력. 이 자기 지도 "추론 학습" 패러다임은 LLM을 더 지능적이고 유능하게 만드는 데 빠른 진전을 가져올 수 있습니다.

고정닉 7

원본 첨부파일 1

Screenshot 2024-03-15 at 8.08.30 PM.png

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2930	설문	논란보다 더 욕 많이 먹어서 억울할 것 같은 스타는?	운영자	24/09/23	-	-
2931	공지	인물 갤러리 서비스 오픈 안내	운영자	24/09/23	-	-
460332	일반	구글 방금 파이썬팀 해고 [37]	ㅇㅇ(125.191)	04.28	4077	21
460316	일반	최근 AI 근황 요약 [33]	ㅇㅇ(218.150)	04.28	5003	58
460315	일반	무뚝뚝한 안드로이드 메이드.manhwa [14]	ㅇㅇ(125.241)	04.28	2216	39
460264	일반	데이비드 샤피로 "올해 1억개의 일자리를 파괴할 gpt-5 agi 기대" [18]	ㅇㅇ(125.191)	04.28	2760	19
460262	일반	양놈들이 보는 'AI 인플루언서' 특 [9]	ㅇㅇ(116.124)	04.28	2999	51
460245	일반	학벌이 뭐가 중요할까요 [36]	좋아해킨드	04.28	3083	29
460233	일반	이새끼들 대학타령 하고 있네 [11]	ㅇㅇ(58.29)	04.28	2043	20
460201	정보/ 정보/뉴스	어도비, '파이어플라이 이미지 3' 출시...'포토샵'에 생성 AI 통합 [3]	ㅇㅇ(182.230)	04.28	1291	15
460139	일반	클린 념글 보는 법 [8]	SMN	04.27	1831	28
460091	정보/ 정보/뉴스	OpenAI 소라 경쟁 Vidu 출시 [22]	선갤러(125.191)	04.27	2618	28
460089	일반	독일 재생에너지 50% 넘음 [20]	ㅇㅇ(220.73)	04.27	1214	16
460088	정보/ 정보/뉴스	전 FDA 국장 "생명공학의 변곡점이 오고 있다" [22]	선갤러(125.191)	04.27	3434	35
460036	정보/ 정보/뉴스	애플, 오픈AI와 협상 재개...'시리'에 '챗GPT' 통합 추진할 듯 [12]	ㅇㅇ(182.230)	04.27	642	13
460011	일반	국내연구진은 거른다면서 [48]	ㅇㅇ(114.205)	04.27	3234	74
460002	역노화	피세틴 임상 2a상 시작 했습니다. [74]	좋아해킨드	04.27	4863	38
459997	일반	오픈 ai 지하실 상황 [5]	ㅇㅇ(1.229)	04.27	4035	31
459992	일반	뒤에서 지랄 떨지 말고 맞다이로 gpt5 들어와	ㅇㅇ(110.46)	04.27	1871	32
459964	일반	AI 안전 및 보안위원회 명단 [4]	ㅇㅇ(125.191)	04.26	985	13
459936	일반	죽는거에요???? [18]	ㅇㅇ	04.26	4329	69
459930	정보/ 정보/뉴스	생생한 Sora 실사용 후기 [29]	ㅇㅇ(119.77)	04.26	4155	40
459884	정보/ 정보/뉴스	Astribot S1 로봇 [2]	ㅇㅇ(125.191)	04.26	220	12
459876	정보/ 정보/뉴스	딥마인드, 미세조정 없이 성능 개선하는 ‘다중샷 상황 내 학습’ 공개 [11]	ㅇㅇ(182.230)	04.26	1943	26
459870	정보/ 정보/뉴스	MS·구글, 클라우드 성장으로 실적 양호..."메타 같은 사태 피했다" [1]	ㅇㅇ(182.230)	04.26	1252	17
459866	정보/ 정보/뉴스	글로벌 CIO "AI 투자 증가 96%, 2년내 수익률 입증 가능성 X" [2]	ㅇㅇ(182.230)	04.26	1346	20
459861	정보/ 정보/뉴스	찍이점) 줄기세포로 뇌 신경세포도 재생...돌이킬 수 없는 뇌손상 고칠까 [12]	ㅇㅇ(182.230)	04.26	2399	22
459859	정보/ 정보/뉴스	세계 두번째 유전자 조작 돼지 신장 사람에 이식 성공 [1]	ㅇㅇ(182.230)	04.26	1104	22
459855	정보/ 정보/뉴스	"배터리, 더이상 일회용품 아냐…소듐·전고체·리튬황 배터리 부상" [4]	ㅇㅇ(182.230)	04.26	1085	14
459854	정보/ 정보/뉴스	로봇은 왜 동물보다 빨리 달리지 못할까 [8]	ㅇㅇ(182.230)	04.26	1435	15
459853	정보/ 정보/뉴스	호주, 재생 에너지로 1분기 전력 3분의 1 이상 생산 [15]	ㅇㅇ(182.230)	04.26	1063	15
459829	일반	"유튜브동영상 몇개 긴빠이쳤나요?" [10]	ㅇㅇ(222.101)	04.26	2445	26
459751	일반	AI 얘기만 해서 불만인 좃유입 씨~빨람들 필독ㅋㅋ [21]	ㅇㅇ(61.74)	04.26	2364	60
459741	정보/ 정보/뉴스	전OAI직원 : 과대광고를 피하세요. [7]	ㅇㅇ(119.77)	04.26	1484	15
459729	정보/ 정보/뉴스	에릭슈미트 "가능한 빠르게 ai 개발해야 해" [12]	ㅇㅇ(125.191)	04.26	2476	27
459689	정보/ 정보/뉴스	샘알트만 스탠포드 강연 내용 번역본 [20]	ㅇㅇ(119.77)	04.26	2697	20
459726	일반	미국 쓰로우플레임, 화염방사기 로봇개 출시 [20]	ㅇㅇ(218.150)	04.26	1290	23
459720	일반	Gpt 4 능가한 중국의 LLM [10]	ㅇㅇ(116.120)	04.26	1925	17
459693	정보/ 정보/뉴스	현재 AI 한계, 단점 보완 연구 및 스타트업 무쓸모행 [15]	ㅇㅇ(119.77)	04.26	2703	31
459664	정보/ 정보/뉴스	2시간만에 다이아몬드 생산 해냄.news [10]	007빵(175.194)	04.25	898	20
459649	일반	알트만 또 하나의 업보 적립... [9]	ㅇㅇ(119.77)	04.25	1706	15
459625	일반	gpt5에 대한 기대감이 크게 떨어진 사건 [1]	ㅇㅇ(221.168)	04.25	1602	17
459603	정보/ 정보/뉴스	"애플, 수요 부족으로 비전 프로 생산 조기 중단" [26]	ㅇㅇ(182.230)	04.25	2550	23
459556	일반	OpenAI 4월 29일 GPT4 업그레이드 가능성 [18]	모브	04.25	2786	19
459547	일반	특갤사이클 존나 웃기다니까 [6]	ㅇㅇ(106.102)	04.25	2038	49
459519	일반	스탠포드 병신이 비밀이라 했던거 [17]	ㅇㅇ(119.77)	04.25	2541	21
459493	일반	알트만 씨발놈 소식은 gpt5 공개될때까지 임시 언급금지 때리면 안됨? [10]	ㅇㅇ(118.33)	04.25	2445	54
459489	정보/ 정보/뉴스	AI 모델에서 "그것"은 데이터셋이다. [7]	ㅇㅇ(61.73)	04.25	1858	24
459484	일반	이거 ㅈㄴ웃기네 [19]	헬스토끼	04.25	2544	23
459478	일반	클로드 오늘 어마어마한 업뎃함 [10]	ㅇㅇ(115.138)	04.25	920	10
459429	정보/ 정보/뉴스	플라톤 무덤 위치 미스터리, AI로 밝혀냈다 [29]	ㅇㅇ	04.25	2918	34
459224	정보/ 정보/뉴스	상상할 수 있는 최악의 질문을 생성한 대가로 보상을 받는 '독성 AI' [17]	ㅇㅇ	04.24	1603	21