디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 셀프 플레이 적대 언어 게임은 LLM 추론을 향상시킵니다.

특술람갤로그로 이동합니다. 2024.04.17 11:33:53
조회 241 추천 6 댓글 4
														

https://arxiv.org/abs/2404.10642



2인용 적대 언어 게임인 Adversarial Taboo를 통해 대규모 언어 모델(LLM)의 자가 학습 절차를 살펴봅니다. 이 게임에서 공격자와 방어자는 공격자에게만 보이는 목표 단어와 관련하여 의사소통을 합니다. 공격자는 방어자가 무의식적으로 목표 단어를 말하도록 유도하고, 방어자는 공격자의 말에서 목표 단어를 유추하려고 합니다. 게임에서 승리하기 위해서는 두 플레이어 모두 목표 단어에 대한 충분한 지식과 정보가 제한된 대화에서 추론하고 표현할 수 있는 고도의 추론 능력이 있어야 합니다. 따라서 저희는 이 적대적 언어 게임(SPAG)에서 셀프 플레이를 통해 LLM의 추론 능력이 더욱 향상될 수 있는지 궁금합니다. 이를 위해 저희는 LLM이 공격자 역할을 하고, 광범위한 목표 단어에 대해 스스로를 방어자로 삼아 게임을 하게 했습니다. 게임 결과에 대한 강화 학습을 통해 광범위한 추론 벤치마크에서 LLM의 성능이 균일하게 향상되는 것을 관찰했습니다. 또한 이러한 셀프 플레이 프로세스를 반복적으로 도입하면 LLM의 추론 능력을 지속적으로 향상시킬 수 있습니다.




3eb8dc20f5de39bf20afd8b236ef203e8cd365d71a63709f



2caed468f5dc3f8650bbd58b3688756b77ee


7ff3c028e2f206a26d81f6e04189736b


a76f00ad241276b660b8f68b12d21a1d471f97bf8b



자동등록방지

추천 비추천

6

고정닉 4

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2856 설문 주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는? 운영자 24/04/29 - -
461440 일반 일반인들이 원하는 GPT-5(가칭) 수준은 이런거 같고 불가능함 [11] ㅇㅇ(14.53) 04.30 294 0
461439 일반 의식의 흐름 갤러리 ㅇㅇ(211.46) 04.30 48 0
461438 일반 ㅌㅇㅈ ㅈㅂ 193ㅇㅊ [6] 포스트휴먼.갤로그로 이동합니다. 04.30 82 1
461437 일반 다이이몬드로 이런것도 진짜되나보네 [4] ㅇㅇ(218.50) 04.30 211 0
461436 일반 chatgpt지금 4.5임? [1] ㅇㅇ갤로그로 이동합니다. 04.30 156 0
461435 일반 이게 어케 gpt5냐 하.. ㅇㅇ(58.29) 04.30 124 0
461434 일반 인간의 뇌를 완벽히 따라할수는 없지만. [1] ㄷㄷ(59.24) 04.30 74 1
461433 일반 ??? : 어..? 생각보다 반응 괜찮네??? [2] ㅇㅇ(221.147) 04.30 350 5
461432 일반 생각해보면 gpt-5의 성능을 알고있는 샘 알트만이 [1] ㅇㅇ(122.34) 04.30 129 1
461431 일반 이게 GPT-5(가칭)이 맞다. 그 정도 수준이야 박사급 맞음 [9] ㅇㅇ(14.53) 04.30 311 1
461430 일반 상압 다이아몬드 제조도 존나 큰 뉴스라고 생각합니다 [8] 잭더리퍼갤로그로 이동합니다. 04.30 216 6
461429 일반 챗봇 아레나 처음으로 해본 소감 [2] 천사다천사갤로그로 이동합니다. 04.30 129 1
461428 일반 추론 능력은 터보와 도찐개찐인데 [2] ㅇㅇ(121.160) 04.30 118 0
461427 일반 외계인 외계문명 발견되도 큰 파장은 없을꺼임 [9] ㅇㅇ(211.244) 04.30 176 0
461426 일반 저게 GPT-5가 아니라해도 많이 다를거같음? ㅇㅇ(122.34) 04.30 59 0
461425 일반 절대 gpt-5는 아닐것임 ㅇㅇ(221.152) 04.30 64 0
461424 일반 진짜 이게 gpt5일까봐 [1] ㅇㅇ(211.185) 04.30 184 3
461423 일반 gpt2.0이라기엔 너무 부족하고 [3] ㅇㅇ(211.185) 04.30 243 0
461422 일반 gpt2 쓰는사람들아 보고싶은 소설 이렇게 오더하삼 ㅇㅇ(221.152) 04.30 122 1
461421 일반 GPT2-chatbot>>>>GPT-4 맞다 천사다천사갤로그로 이동합니다. 04.30 161 1
461420 일반 속보)방금 샘 알트만 트윗으로 GPT2 성능 암시함 ㄷㄷㄷㄷㄷㄷㄷ [2] ㅇㅇ(180.65) 04.30 521 1
461419 일반 미래는 드론이다....... Samus갤로그로 이동합니다. 04.30 80 0
461418 일반 진짜 답변이 유목화 돼서 탁탁탁 나오니까 너무 좋다 ㅇㅇ(14.53) 04.30 95 0
461417 정보 블레이즈, 엣지 AI 프로세서로 1500억 펀딩..."엣지 AI가 대세" ㅇㅇ(182.230) 04.30 105 2
461416 일반 걍 GPT-5=Sora+GPT2 인 거 아니냐??? [6] 트라야누스(14.32) 04.30 251 0
461415 정보 구글 자회사, AI 에이전트 탑재 '오디오 컴퓨터' 개발 중 [2] ㅇㅇ(182.230) 04.30 93 2
461414 일반 아는 만큼 보인다고 지금 ChatGPT2-Chatbot이 넘사벽이라는걸 [9] ㅇㅇ(14.53) 04.30 279 0
461413 정보 SKT, 특화 LLM ‘텔코‘ 6월 출시…"에이닷X·GPT·클로드 제공" ㅇㅇ(182.230) 04.30 72 1
461412 정보 머스크, 중국 방문 이후 테슬라 주가 폭등..."자,산 51조 추가" [2] ㅇㅇ(182.230) 04.30 130 2
461411 정보 오픈AI, AI 모델 훈련에 FT 기사 활용 계약 [3] ㅇㅇ(182.230) 04.30 117 1
461410 일반 내가 짠 프롬프트지만 병맛이긴하네 어쨋건 지금까지 투표안하고 했는데 맞네 [1] ㅇㅇ(14.53) 04.30 120 0
461409 일반 근데 은근슬쩍 점점 gpt4 좆밥 취급되지 않음? [1] ㅇㅇ(1.240) 04.30 167 0
461408 일반 나는 이만 떠나야겠다 ㅇㅇ갤로그로 이동합니다. 04.30 105 0
461407 정보 '킬러 로봇' 규제 위해 143개국 모였다 [2] ㅇㅇ(182.230) 04.30 107 2
461406 일반 너를 뭐라고 부를까? 라고 해봐라 자기가 GPT-4라고함 [2] ㅇㅇ(14.53) 04.30 143 0
461405 정보 구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개 [1] ㅇㅇ(182.230) 04.30 118 2
461404 일반 챗봇아레나의 gpt2-chatbot이 OpenAI꺼라는 오피셜도 없음 [2] 챗GPT갤로그로 이동합니다. 04.30 216 0
461403 일반 아니 투표하면 정체 나와? ㅋㅋㅋㅋㅋㅋㅋㅋ ;; [2] ㅇㅇ(14.53) 04.30 136 0
461402 정보 LGU+, 파주에 초거대 데이터센터 건설..."AI 경쟁력 높인다" [1] ㅇㅇ(182.230) 04.30 86 3
461401 정보 "애플, 스위스 비밀 연구소에서 'MM1' 모델 개발" [1] ㅇㅇ(182.230) 04.30 138 2
461400 정보 5월 서울서 '글로벌 AI 서밋' 개최...주요국 불참 지적 [1] ㅇㅇ(182.230) 04.30 98 1
461399 일반 그럼 앞으로는 GPT2-1, GPT2-2 이런 식임??? [9] 트라야누스(14.32) 04.30 247 0
461398 정보 KAIST-네이버-인텔, ‘AI 공동연구센터’ 설립...가우디 최적화 중 [2] ㅇㅇ(182.230) 04.30 106 3
461397 일반 gpt2 연애 조언 차원이 다르게 잘해주네 [7] ㅇㅇ(182.211) 04.30 250 0
461396 일반 겨울이다... ㅇㅇ(110.46) 04.30 37 0
461395 일반 gpt2 추론능력은 뭐 그저 그렇네.. [4] ㅇㅇ(220.67) 04.30 250 1
461394 일반 석기시대 돌입.jpg [11] ㅇㅇ갤로그로 이동합니다. 04.30 340 1
461393 일반 나만 gpt2 안돼냐 [2] 이희승갤로그로 이동합니다. 04.30 177 0
461392 일반 앞으로 단순정보 전달 유튜브는 망할듯 [1] ㅇㅇ갤로그로 이동합니다. 04.30 73 0
461391 일반 그래서 큰 거 오긴 한거임?큰거맞음? [1] ㅇㅇ(110.46) 04.30 65 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2