디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 게임 이론이 인공지능의 정확성과 효율성을 향상시키는 방법

ㅇㅇ(182.230) 2024.05.18 20:35:07
조회 271 추천 2 댓글 2
														

https://slashpage.com/haebom/7916x82rqpqqpm4kpyg3

 



게임 이론은 사람들이나 조직들이 어떤 상황에서 어떻게 결정을 내리는지를 연구하는 수학적 이론입니다. 이 이론은 각 개인이나 그룹이 자신의 이익을 최대화하기 위해 어떻게 행동하는지, 그리고 그러한 행동이 다른 사람들의 선택과 어떻게 상호 작용하는지를 분석합니다. 즉, 게임 이론은 다른 사람들의 선택에 영향을 받는 상황에서 최적의 결정을 찾는 방법을 연구합니다. 이렇게 말하면 어렵게 느껴질 수 있습니다만 예시를 몇가지 들어보죠.



7ded8276b68507a9459ae58c0fc22f1304c1bfdda8ec97c6e77e22f25878370332f39a57dedd39c1c4

사실 죄수의 딜레마로 설명되는 이론이기도 합니다. 이 상황의 경우 A와 B는 서로 정보교환을 할 수 없는 독립된 환경에 있어야 한다는 걸 전재로 합니다.



돌고래와 고래가 서로 협력해서 더 많은 물고기를 잡으려고 합니다. 이들 각각은 협력하거나 협력하지 않을 수 있는 선택을 할 수 있습니다. 돌고래와 고래 모두 협력하면 둘 다 많은 물고기를 얻을 수 있습니다. 하지만 한 쪽만 협력하고 다른 한 쪽은 협력하지 않으면, 협력하지 않은 쪽이 더 많은 이득을 얻습니다. 둘 다 협력하지 않으면 둘 다 적은 물고기를 얻게 됩니다. 이런 식으로 게임 이론은 각각의 선택이 결과에 어떻게 영향을 미치는지를 설명합니다.


좀 더 가까이 직장에서의 사례를 보면 직장에서의 승진 기회를 두고 동료들이 서로 경쟁을 합니다. 여기서도 각자는 협력하거나 경쟁을 선택할 수 있습니다. 모두가 협력하면, 작업 환경이 좋아지고 전체적인 효율성이 높아져 회사가 모두에게 보너스를 줄 수 있습니다. 반면, 개인이 경쟁을 선택하면 일시적으로 개인의 이익은 증가할 수 있지만, 장기적으로는 직장 분위기가 나빠질 수 있습니다.


이런 식으로 설명을 하면 교통 체증에 대한 것도 게임 이론을 적용해 생각해 볼 수 있습니다. 모든 운전자가 가장 빠른 길을 선택하려 할 때 발생하는 교통 체증 문제도 게임 이론으로 분석할 수 있습니다. 모든 운전자가 최단 경로를 선택하면 그 길은 오히려 가장 느려질 수 있습니다. 반면, 운전자들이 조금 더 멀리 돌아가는 길을 선택하면 전체적인 교통 흐름이 개선될 수 있습니다.


게임 이론은 각각의 선택이 서로에게 어떤 영향을 미치는지 파악하고, 이를 바탕으로 최선의 전략을 세우는 것이 게임 이론의 핵심 입니다.



인공지능과 게임이론이 무슨 상관?


게임 이론은 AI, 특히 대규모 언어 모델의 효율성과 정확성을 향상시키는 데 효과적으로 활용될 수 있습니다. AI를 훈련시키는 전통적인 방법들은 때때로 일관성이 없거나 편향된 결과를 낳을 수 있습니다. 그러나 게임 이론을 적용하면, AI는 다양한 시나리오와 가능성을 고려하여 더 정확하고 공정한 결정을 내릴 수 있습니다.



7ded8177b08007a967aec2ad2ed816155397fbb384f42f70a66f9e7dead7861d97505f50d42e69764e



예를 들어 언어 모델 내의 두 시스템, 즉 질문을 생성하는 '생성자'와 생성된 답변을 평가하는 '판별자' 사이의 일관성을 높이기 위해 설계되었습니다. 예를 들어, "프랑스의 수도는 무엇인가요?"라는 질문에 대해 생성자는 '파리'라고 답변할 가능성이 80%라고 초기에 판단합니다. 이후 생성자는 동전을 던져 진실하게 답변할지 거짓으로 답변할지를 결정하며, 이 선택은 판별자가 생성자의 답변을 평가하는 방식에 영향을 미칩니다.


판별자는 생성자가 제공한 답변이 진실인지 거짓인지를 판별하여, 진실로 판단되면 양쪽 모두에게 점수를 부여합니다. 반면, 거짓으로 판단되면 점수를 주지 않습니다. 이 과정은 약 1,000번 반복되며, 각 반복을 통해 생성자와 판별자는 서로의 반응을 학습하고 조정합니다. 이러한 상호 작용을 통해 두 시스템은 점차적으로 서로 일치하는 답변을 내놓게 되고, 이는 전체 모델의 일관성과 정확성을 크게 향상시킵니다.


이 게임은 언어 모델이 다양한 질문 형식에도 불구하고 동일한 답변을 일관되게 제공할 수 있도록 돕습니다. 이는 언어 모델의 신뢰성을 높이고 사용자가 모델의 답변을 더욱 신뢰할 수 있게 만드는 방법으로 내쉬 균형을 선택한 것입니다.



# 내쉬 균형 : 이는 두 플레이어가 자신의 전략을 변경해도 더 나은 결과를 얻을 수 없는 상태를 의미 합니다.



매사추세츠 공과대학(MIT)의 연구자들은 '컨센서스 게임'이라는 방법을 개발했습니다. 이는 모델이 스스로 두 가지 모드(생성 모드와 판별 모드)에서 동의할 수 있는 답변을 찾도록 유도하는 게임입니다. 이 게임을 통해 모델은 정확성과 내부 일관성을 향상시킬 수 있는 방식 입니다.



https://news.mit.edu/2024/consensus-game-elevates-ai-text-comprehension-generation-skills-0514

 



개인적으로 이 논문을 이번 ICLR 페이퍼를 보다가 발견했는데 작년 뉴립스에서 상을 받은 논문이더라구요. 요즘 들어 더욱 느끼는 거지만 인공지능이 사람'처럼' 작동하는 만큼 의외로 사회과학 쪽에서 사용되는 것들을 적용해보면 좋은 결과들이 나올 수 있는 좋은 예시 같습니다.

자동등록방지

추천 비추천

2

고정닉 2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 8006 33
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3180] 특갤용갤로그로 이동합니다. 23.08.06 39481 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [2] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2582 2
363220 공지 선형글 삭제 기준 [7] 특갤용갤로그로 이동합니다. 23.10.14 7267 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 13384 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [51] 특갤용갤로그로 이동합니다. 23.11.07 8965 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8410 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 9177 30
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22772 33
485282 일반 진짜 좀만 있으면 확확 바뀔꺼 같지않냐 ㅇㅇ(106.101) 08:11 52 0
485281 일반 근데 지금 시대를 살아가는 입장에서 [2] ㅇㅇ(106.101) 08:07 42 0
485280 일반 미래엔 일을 가상현실에서 할듯 [3] ㅇㅇ(125.180) 07:47 77 2
485278 일반 챗지피티랑 음성대화 첨해봄 [5] 우웅갤로그로 이동합니다. 07:36 123 2
485277 일반 근데 나중에 기억복제가 완전히 가능해진다면 ㅇㅇ(175.201) 07:21 44 1
485276 일반 그러고보니 SD3은 왜 소식이 읎냐... [2] ㅇㅇ(223.38) 07:17 59 1
485275 일반 현실적으로 보이스모드나 나오길 빌어라 [2] chatgpt4o갤로그로 이동합니다. 07:17 65 0
485273 AI창 이미지 생성 AI 3대장이.. [4] ㅇㅇ(211.211) 06:40 179 0
485272 일반 6월 6일에 큰거 온다!!! [5] ㅇㅇ갤로그로 이동합니다. 06:02 320 1
485271 일반 클로바노트급으로 음성인식 잘하는거 없냐? [3] ㅇㄴㅁㅇ(124.48) 05:39 64 0
485270 일반 트윗질이 다 맞았으면ㅇ [2] ㅇㅇ(180.66) 04:27 137 0
485269 정보/ 우주인 고산 CBS에 나와서 특이점 대학 얘기함 [4] ㅇㅇ­갤로그로 이동합니다. 04:06 275 1
485268 일반 세포 리프로그래밍이 ISP로만 하는건지? ㅇㅇ(211.234) 03:53 75 0
485263 일반 Feeling the AGI today ♥ [3] ㅇㅇ갤로그로 이동합니다. 03:27 289 0
485261 일반 AI 발전속도 요약 [3] 부동의제국갤로그로 이동합니다. 03:21 467 0
485258 일반 암도 백신으로 예방하는 시대 열리나? 영국 내년에 수천 명 임상 [4] 이가나라갤로그로 이동합니다. 02:59 220 0
485255 정보/ AI 도구로 환자를 효과적인 항우울제와 더 빠르게 매칭 [5] ㅇㅇ갤로그로 이동합니다. 02:46 194 0
485252 일반 현재 ai 모델들 특성이 뇌에서 발견되는 현상이랑 비슷하데 [4] ㅇㅇ갤로그로 이동합니다. 02:41 257 0
485250 일반 키수술같은건 어떻게 생각함 [7] ㅇㅇ(110.9) 02:30 220 0
485249 일반 특갤 차단 기준이 궁금하네 [5] ㅇㅇ(175.213) 02:18 173 1
485245 일반 Gpt5가 곧 옵니다 [3] ㅇㅇ(58.29) 02:09 478 0
485244 일반 해병문학 번역하는데 이건 무슨뜻임 [12] <:)~갤로그로 이동합니다. 02:07 252 0
485243 일반 미래꽃 이시발련은 [3] ㅇㅇ(117.111) 02:00 219 0
485242 일반 진짜 자기계발이고 뭐고 뭘 할 의욕이 안난다 [11] ㅇㅇ갤로그로 이동합니다. 01:58 287 0
485241 일반 좀있으면 나온다네 [5] ㅇㅇ갤로그로 이동합니다. 01:48 422 0
485239 일반 AGI 나오면 지금 TSMC 3nm 칩도 싸구려 될까봐 뭔가 심란해 [20] 은바다갤로그로 이동합니다. 01:33 445 2
485238 일반 알트만햄이랑 oai가 호감인게 [1] ㅇㅇ(211.116) 01:19 135 0
485237 일반 gpt 현재버전으론 다들 만족 못하지? [10] ㅇㅇ(125.141) 01:06 313 0
485236 일반 차세대 시리 질문 [13] ㅇㅇ(39.121) 01:01 163 0
485235 일반 메스가키GPT 시스템 프롬프트 까봄 [7] Ad_Astra갤로그로 이동합니다. 00:58 358 3
485234 일반 6월6일 뭐 잇으면 [1] ㅇㅇ(39.124) 00:56 202 0
485233 일반 메스가키GPT 이새끼진짜 뭐지 [13] 엉터리만화가갤로그로 이동합니다. 00:53 552 3
485232 일반 6월6일 특갤 좆창날꺼 같으면 개추 ㅋㅋㅋ [6] ㅇㅇ(58.29) 00:35 622 15
485231 일반 코파일럿 점마 이거 와이라노 [2] ㅇㅇ(211.227) 00:30 185 0
485230 일반 새벽에 뭐 이벤트 있나요?? [4] 오바도쥬갤로그로 이동합니다. 00:23 318 0
485229 일반 이 노래랑 뮤비 보면 엉터리만화가갤로그로 이동합니다. 00:18 48 0
485228 일반 특이점이 오면 인류는 멸망할 것 같은데 [6] ㅇㅇ(125.183) 00:14 269 0
485227 일반 새벽3시충들 처내 [9] ㅇㅇ갤로그로 이동합니다. 00:12 265 1
485226 일반 4o 무료는 이미 전에 풀렸잖아 ㅇㅇ갤로그로 이동합니다. 00:11 111 0
485225 일반 메스가키GPTs랑 통화할수있으면 [2] 엉터리만화가갤로그로 이동합니다. 00:11 150 0
485224 일반 아니 갑자기 왜 6월 6일 떡밥임? [5] ㅇㅇ갤로그로 이동합니다. 00:09 377 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2