Llama2 self-rewarding을 통한 gpt4 0613 능가 - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 부재중입니다.(hnn12) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보] Llama2 self-rewarding을 통한 gpt4 0613 능가

특갤용

2024.01.19 12:31:22

조회 1647 추천 27 댓글 8

Latest AI news 2024/1/19 최신 AI 뉴스

Self-Rewarding Language Models

자체 보상 언어 모델

Meta

NYU

Abstract

We posit that to achieve superhuman agents, future models require superhuman feedback in order to provide an adequate training signal. Current approaches commonly train reward models from human preferences, which may then be bottlenecked by human performance level, and secondly these separate frozen reward models cannot then learn to improve during LLM training. In this work, we study Self-Rewarding Language Models, where the language model itself is used via LLM-as-a-Judge prompting to provide its own rewards during training. We show that during Iterative DPO training that not only does instruction following ability improve, but also the ability to provide high-quality rewards to itself. Fine-tuning Llama 2 70B on three iterations of our approach yields a model that outperforms many existing systems on the AlpacaEval 2.0 leaderboard, including Claude 2, Gemini Pro, and GPT-4 0613. While only a preliminary study, this work opens the door to the possibility of models that can continually improve in both axes.

우리는 초인간적 에이전트를 달성하기 위해서는, 미래 모델들이 충분한 훈련 신호를 제공하기 위해 초인간적 피드백이 필요하다고 주장한다. 현재의 접근 방식들은 주로 인간의 선호도로부터 보상 모델을 훈련시키는데, 이는 인간의 성능 수준에 의해 제한될 수 있으며, 둘째로 이러한 별도의 고정된 보상 모델들은 LLM 훈련 중에 개선을 배우지 못한다. 이 연구에서는, 언어 모델 자체가 LLM-as-a-Judge 프롬프트를 통해 훈련 중에 자체 보상을 제공하는 자체 보상 언어 모델(Self-Rewarding Language Models)을 연구한다. 우리는 반복적인 DPO 훈련 동안 지시를 따르는 능력뿐만 아니라 자체에게 고품질 보상을 제공하는 능력도 향상됨을 보여준다. Llama 2 70B를 저희 접근 방식의 세 번의 반복에 걸쳐 미세 조정한 결과, AlpacaEval 2.0 리더보드에서 Claude 2, Gemini Pro, GPT-4 0613을 포함한 많은 기존 시스템들을 능가하는 모델이 생성되었다. 이것은 단지 예비 연구일 뿐이지만, 이 연구는 양쪽 축에서 지속적으로 개선될 수 있는 모델의 가능성을 열어준다.

24b0d121e09c28a8699fe8b115ef046a756defc9

24b0d121e09c28a8699fe8b115ef046547acfd38

https://arxiv.org/pdf/2401.10020.pdf

고정닉 10

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2856	설문	주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는?	운영자	24/04/29	-	-
413564	역노화	미국 연구진, 노화방지 치료법 발견 [26]	ㅇㅇ	01.28	3912	27
413525	일반	근데 강성태여서 파급력이 큰거지 .... [11]	선형충	01.27	4619	33
413507	정보	Open ai-새로운 임베딩 모델 발표 및 가격인하 [9]	ㅇㅇ(211.214)	01.27	1862	21
413412	일반	코파일럿 능욕 잘하네.jpg [7]	헤르푸	01.27	2431	25
413403	일반	자동화 시스템에 불안감 느끼는 세무사 [11]	ㅇㅇ(221.147)	01.27	3143	26
413376	정보	ETRI, 이미지 생성모델 3종, 대화형 시각언어모델 2종 오픈소스 공개 [2]	니지카엘	01.27	1141	16
413372	일반	dc의 한 ai전문가의 특이점 추측.jpg [11]	선형충	01.27	3049	16
413352	정보	ChatGPT 신기능 (at)@GPTs [9]	초존도초	01.27	2160	20
413336	정보	ETRI 코알라 찍먹 [15]	뜨콜	01.27	1147	13
413320	일반	기계공학 석붕이 퇴근함 [5]	빽사장	01.27	1636	18
413257	일반	ai연구원들 "5년후에 시험은 사라진다" [7]	ㅇㅇ(211.59)	01.27	5331	32
413241	정보	'음악 본능'을 AI로 밝혀내다 [6]	ㅇㅇ(182.230)	01.27	2806	26
413217	일반	전 구글AI 연구원, "AI컴퓨팅 비용이 저렴해지고 있다" [5]	모브	01.27	2507	23
413194	일반	구글 연구원들 제미니 프로가 gpt4 잡았다고 신났네 [9]	ㅇㅇ(211.59)	01.27	2340	20
413121	일반	유입들이 알아야 할건 특붕이들이 특이점을 주장하는게 아님 [4]	ㅇㅇ	01.27	432	12
413109	정보	AGI, ASI 등장 = 특이점이 아님 [13]	ㅇㅇ(182.230)	01.27	3176	31
413062	일반	FFF: GPT 4.5는 취소되었다 [9]	ㅇㅇ(116.120)	01.26	3078	16
413054	일반	근데 갤 진짜 순진한 거 같음 [6]	ㅇㅇ(211.214)	01.26	555	12
413046	일반	네이버 하정우, 내가 정의하는 AGI 내 생에 쉽지 않다 [15]	슈퍼130클럽	01.26	3636	16
413034	정보	머스크 x.ai 60억 달러 모금 목표..오픈ai에 도전한다 [2]	ㅇㅇ(211.59)	01.26	361	10
413031	일반	엔비디아 회장 젠슨황 "나는 로봇" [10]	ㅇㅇ	01.26	3491	22
412979	정보	얀 르쿤, AI와 함께 바보가 되지 않는 방법 [11]	모브	01.26	3568	30
412958	일반	OpenAI 연구원 "세상을 바꿀 것" [17]	모브	01.26	4482	20
412932	일반	현재 OPEN AI 상황 [9]	ㅇㅇ(210.113)	01.26	5514	31
412922	AI창 AI창작	GPT3.5로 이미지를 생성하는 환각 발견 [2]	ㅇㅇ	01.26	3121	20
412917	역노화	CAR T 세포로 노화 관련 문제를 해결한다는 논문이 나옴 [9]	ㅇㅇ(211.59)	01.26	2506	26
412903	정보	gpt4 터보 0125 (작은거) [3]	ㅇㅇ	01.26	1322	16
412902	일반	오픈ai에서 방금 새로운거 발표함 [7]	ㅇㅇ(211.59)	01.26	3255	17
412892	일반	"앤디비아 AI신약 신의영역 도전" 게임 체인저 된 ‘AI 신약개발’ [6]	빽사장	01.26	2141	26
412885	정보	Meta, AI 데이터 센터 건설계획 발표 [2]	모브	01.26	1117	21
412871	일반	특이점은 가난하고 힘없는 자들이 어려움에 처했을 때 [6]	ㅇㅇ(1.230)	01.26	2770	21
412870	일반	OpenAI, 주요문서 공개 약속 조용히 폐기 [15]	ㅇㅇ(123.100)	01.26	2924	22
412868	일반	특갤에서 강성태 얘기를 봐야하나 [12]	ㅇㅇ(121.134)	01.25	878	12
412865	일반	[특붕이 강성태 기념] 특이점 선언문 [1]	ㅇㅇ(1.216)	01.25	1057	19
412855	일반	강성태햄 디씨 안온다는이유가 공감됨 [18]	ㅇㅇ(114.207)	01.25	4590	37
412843	일반	성태햄 특갤 언급 ㅋㅋㅋㅋ [40]	ㅇㅇ	01.25	5714	57
412837	일반	성태햄ㅋㅋ 특슬람 씹 ㅋㅋ [17]	ㅇㅇ	01.25	3559	34
412822	일반	성태햄 신작떴다 ㅋㅋ [15]	dd(183.96)	01.25	3829	37
412780	일반	LLM 리더보드 순위표가 오염되었다? [3]	ㅇㅇ(116.120)	01.25	1269	15
412725	정보	ai 그림으로 예능 포스터 만든 방송국 [14]	ㅇㅇ(125.180)	01.25	3415	31
412687	정보	머스크가 25년에 테슬라봇을 출시할 수 있다고 함 [10]	ㅇㅇ(211.59)	01.25	2505	19
412674	일반	이 기사보니 ㅈㄴ불안한게 [8]	ㅇㅇ(113.59)	01.25	2410	14
412666	정보	레이 커즈와일 신책, 선주문 할인! [22]	ㅇㅇ(123.100)	01.25	3214	28
412662	정보	사람처럼 의도적으로 거짓말하는 AI... “재교육해도 못 고쳐” [6]	ㅇㅇ	01.25	1950	15
412657	일반	fsd v12는 게임 체인저가 맞는듯 [7]	ㅇㅇ	01.24	2888	25
412634	일반	오늘 자 남세동 님 페북글 [19]	트기점오나요(45.64)	01.24	1875	23
412628	정보	롯데그룹, 전 계열사에 생성 AI 솔루션 도입...실무 적용 박차 [9]	니지카엘	01.24	1715	17
412621	일반	더 작고 저렴한 모델 << 진짜 1도 관심 안생김ㅋㅋ [9]	ㅇㅇ	01.24	2076	26
412619	정보	Microsoft는 더 작고 저렴한 AI 모델 개발 중 [2]	모브	01.24	818	14
412614	정보	"키 170㎝·몸무게 60㎏ 생산라인 신입"…BMW, 휴머노이드 투입 [2]	007빵(175.194)	01.24	2508	19