디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] Llama2 self-rewarding을 통한 gpt4 0613 능가

특갤용갤로그로 이동합니다. 2024.01.19 12:31:22
조회 1647 추천 27 댓글 8
														

Latest AI news 2024/1/19 최신 AI 뉴스



Self-Rewarding Language Models

자체 보상 언어 모델


Meta

NYU


Abstract

We posit that to achieve superhuman agents, future models require superhuman feedback in order to provide an adequate training signal. Current approaches commonly train reward models from human preferences, which may then be bottlenecked by human performance level, and secondly these separate frozen reward models cannot then learn to improve during LLM training. In this work, we study Self-Rewarding Language Models, where the language model itself is used via LLM-as-a-Judge prompting to provide its own rewards during training. We show that during Iterative DPO training that not only does instruction following ability improve, but also the ability to provide high-quality rewards to itself. Fine-tuning Llama 2 70B on three iterations of our approach yields a model that outperforms many existing systems on the AlpacaEval 2.0 leaderboard, including Claude 2, Gemini Pro, and GPT-4 0613. While only a preliminary study, this work opens the door to the possibility of models that can continually improve in both axes.


우리는 초인간적 에이전트를 달성하기 위해서는, 미래 모델들이 충분한 훈련 신호를 제공하기 위해 초인간적 피드백이 필요하다고 주장한다. 현재의 접근 방식들은 주로 인간의 선호도로부터 보상 모델을 훈련시키는데, 이는 인간의 성능 수준에 의해 제한될 수 있으며, 둘째로 이러한 별도의 고정된 보상 모델들은 LLM 훈련 중에 개선을 배우지 못한다. 이 연구에서는, 언어 모델 자체가 LLM-as-a-Judge 프롬프트를 통해 훈련 중에 자체 보상을 제공하는 자체 보상 언어 모델(Self-Rewarding Language Models)을 연구한다. 우리는 반복적인 DPO 훈련 동안 지시를 따르는 능력뿐만 아니라 자체에게 고품질 보상을 제공하는 능력도 향상됨을 보여준다. Llama 2 70B를 저희 접근 방식의 세 번의 반복에 걸쳐 미세 조정한 결과, AlpacaEval 2.0 리더보드에서 Claude 2, Gemini Pro, GPT-4 0613을 포함한 많은 기존 시스템들을 능가하는 모델이 생성되었다. 이것은 단지 예비 연구일 뿐이지만, 이 연구는 양쪽 축에서 지속적으로 개선될 수 있는 모델의 가능성을 열어준다.

24b0d121e09c28a8699fe8b115ef046a756defc9


24b0d121e09c28a8699fe8b115ef046547acfd38



https://arxiv.org/pdf/2401.10020.pdf



자동등록방지

추천 비추천

27

고정닉 10

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2856 설문 주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는? 운영자 24/04/29 - -
413564 역노화 미국 연구진, 노화방지 치료법 발견 [26] ㅇㅇ갤로그로 이동합니다. 01.28 3912 27
413525 일반 근데 강성태여서 파급력이 큰거지 .... [11] 선형충갤로그로 이동합니다. 01.27 4619 33
413507 정보 Open ai-새로운 임베딩 모델 발표 및 가격인하 [9] ㅇㅇ(211.214) 01.27 1862 21
413412 일반 코파일럿 능욕 잘하네.jpg [7] 헤르푸갤로그로 이동합니다. 01.27 2431 25
413403 일반 자동화 시스템에 불안감 느끼는 세무사 [11] ㅇㅇ(221.147) 01.27 3143 26
413376 정보 ETRI, 이미지 생성모델 3종, 대화형 시각언어모델 2종 오픈소스 공개 [2] 니지카엘갤로그로 이동합니다. 01.27 1141 16
413372 일반 dc의 한 ai전문가의 특이점 추측.jpg [11] 선형충갤로그로 이동합니다. 01.27 3049 16
413352 정보 ChatGPT 신기능 (at)@GPTs [9] 초존도초갤로그로 이동합니다. 01.27 2160 20
413336 정보 ETRI 코알라 찍먹 [15] 뜨콜갤로그로 이동합니다. 01.27 1147 13
413320 일반 기계공학 석붕이 퇴근함 [5] 빽사장갤로그로 이동합니다. 01.27 1636 18
413257 일반 ai연구원들 "5년후에 시험은 사라진다" [7] ㅇㅇ(211.59) 01.27 5331 32
413241 정보 '음악 본능'을 AI로 밝혀내다 [6] ㅇㅇ(182.230) 01.27 2806 26
413217 일반 전 구글AI 연구원, "AI컴퓨팅 비용이 저렴해지고 있다" [5] 모브갤로그로 이동합니다. 01.27 2507 23
413194 일반 구글 연구원들 제미니 프로가 gpt4 잡았다고 신났네 [9] ㅇㅇ(211.59) 01.27 2340 20
413121 일반 유입들이 알아야 할건 특붕이들이 특이점을 주장하는게 아님 [4] ㅇㅇ갤로그로 이동합니다. 01.27 432 12
413109 정보 AGI, ASI 등장 = 특이점이 아님 [13] ㅇㅇ(182.230) 01.27 3176 31
413062 일반 FFF: GPT 4.5는 취소되었다 [9] ㅇㅇ(116.120) 01.26 3078 16
413054 일반 근데 갤 진짜 순진한 거 같음 [6] ㅇㅇ(211.214) 01.26 555 12
413046 일반 네이버 하정우, 내가 정의하는 AGI 내 생에 쉽지 않다 [15] 슈퍼130클럽갤로그로 이동합니다. 01.26 3636 16
413034 정보 머스크 x.ai 60억 달러 모금 목표..오픈ai에 도전한다 [2] ㅇㅇ(211.59) 01.26 361 10
413031 일반 엔비디아 회장 젠슨황 "나는 로봇" [10] ㅇㅇ갤로그로 이동합니다. 01.26 3491 22
412979 정보 얀 르쿤, AI와 함께 바보가 되지 않는 방법 [11] 모브갤로그로 이동합니다. 01.26 3568 30
412958 일반 OpenAI 연구원 "세상을 바꿀 것" [17] 모브갤로그로 이동합니다. 01.26 4482 20
412932 일반 현재 OPEN AI 상황 [9] ㅇㅇ(210.113) 01.26 5514 31
412922 AI창 GPT3.5로 이미지를 생성하는 환각 발견 [2] ㅇㅇ갤로그로 이동합니다. 01.26 3121 20
412917 역노화 CAR T 세포로 노화 관련 문제를 해결한다는 논문이 나옴 [9] ㅇㅇ(211.59) 01.26 2506 26
412903 정보 gpt4 터보 0125 (작은거) [3] ㅇㅇ갤로그로 이동합니다. 01.26 1322 16
412902 일반 오픈ai에서 방금 새로운거 발표함 [7] ㅇㅇ(211.59) 01.26 3255 17
412892 일반 "앤디비아 AI신약 신의영역 도전" 게임 체인저 된 ‘AI 신약개발’ [6] 빽사장갤로그로 이동합니다. 01.26 2141 26
412885 정보 Meta, AI 데이터 센터 건설계획 발표 [2] 모브갤로그로 이동합니다. 01.26 1117 21
412871 일반 특이점은 가난하고 힘없는 자들이 어려움에 처했을 때 [6] ㅇㅇ(1.230) 01.26 2770 21
412870 일반 OpenAI, 주요문서 공개 약속 조용히 폐기 [15] ㅇㅇ(123.100) 01.26 2924 22
412868 일반 특갤에서 강성태 얘기를 봐야하나 [12] ㅇㅇ(121.134) 01.25 878 12
412865 일반 [특붕이 강성태 기념] 특이점 선언문 [1] ㅇㅇ(1.216) 01.25 1057 19
412855 일반 강성태햄 디씨 안온다는이유가 공감됨 [18] ㅇㅇ(114.207) 01.25 4590 37
412843 일반 성태햄 특갤 언급 ㅋㅋㅋㅋ [40] ㅇㅇ갤로그로 이동합니다. 01.25 5714 57
412837 일반 성태햄ㅋㅋ 특슬람 씹 ㅋㅋ [17] ㅇㅇ갤로그로 이동합니다. 01.25 3559 34
412822 일반 성태햄 신작떴다 ㅋㅋ [15] dd(183.96) 01.25 3829 37
412780 일반 LLM 리더보드 순위표가 오염되었다? [3] ㅇㅇ(116.120) 01.25 1269 15
412725 정보 ai 그림으로 예능 포스터 만든 방송국 [14] ㅇㅇ(125.180) 01.25 3415 31
412687 정보 머스크가 25년에 테슬라봇을 출시할 수 있다고 함 [10] ㅇㅇ(211.59) 01.25 2505 19
412674 일반 이 기사보니 ㅈㄴ불안한게 [8] ㅇㅇ(113.59) 01.25 2410 14
412666 정보 레이 커즈와일 신책, 선주문 할인! [22] ㅇㅇ(123.100) 01.25 3214 28
412662 정보 사람처럼 의도적으로 거짓말하는 AI... “재교육해도 못 고쳐” [6] ㅇㅇ갤로그로 이동합니다. 01.25 1950 15
412657 일반 fsd v12는 게임 체인저가 맞는듯 [7] ㅇㅇ갤로그로 이동합니다. 01.24 2888 25
412634 일반 오늘 자 남세동 님 페북글 [19] 트기점오나요(45.64) 01.24 1875 23
412628 정보 롯데그룹, 전 계열사에 생성 AI 솔루션 도입...실무 적용 박차 [9] 니지카엘갤로그로 이동합니다. 01.24 1715 17
412621 일반 더 작고 저렴한 모델 << 진짜 1도 관심 안생김ㅋㅋ [9] ㅇㅇ갤로그로 이동합니다. 01.24 2076 26
412619 정보 Microsoft는 더 작고 저렴한 AI 모델 개발 중 [2] 모브갤로그로 이동합니다. 01.24 818 14
412614 정보 "키 170㎝·몸무게 60㎏ 생산라인 신입"…BMW, 휴머노이드 투입 [2] 007빵(175.194) 01.24 2508 19
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2