디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 게임 이론이 인공지능의 정확성과 효율성을 향상시키는 방법

ㅇㅇ(182.230) 2024.05.18 20:35:07
조회 284 추천 2 댓글 2
														

https://slashpage.com/haebom/7916x82rqpqqpm4kpyg3

 



게임 이론은 사람들이나 조직들이 어떤 상황에서 어떻게 결정을 내리는지를 연구하는 수학적 이론입니다. 이 이론은 각 개인이나 그룹이 자신의 이익을 최대화하기 위해 어떻게 행동하는지, 그리고 그러한 행동이 다른 사람들의 선택과 어떻게 상호 작용하는지를 분석합니다. 즉, 게임 이론은 다른 사람들의 선택에 영향을 받는 상황에서 최적의 결정을 찾는 방법을 연구합니다. 이렇게 말하면 어렵게 느껴질 수 있습니다만 예시를 몇가지 들어보죠.



7ded8276b68507a9459ae58c0fc22f1304c1bfdda8ec97c6e77e22f25878370332f39a57dedd39c1c4

사실 죄수의 딜레마로 설명되는 이론이기도 합니다. 이 상황의 경우 A와 B는 서로 정보교환을 할 수 없는 독립된 환경에 있어야 한다는 걸 전재로 합니다.



돌고래와 고래가 서로 협력해서 더 많은 물고기를 잡으려고 합니다. 이들 각각은 협력하거나 협력하지 않을 수 있는 선택을 할 수 있습니다. 돌고래와 고래 모두 협력하면 둘 다 많은 물고기를 얻을 수 있습니다. 하지만 한 쪽만 협력하고 다른 한 쪽은 협력하지 않으면, 협력하지 않은 쪽이 더 많은 이득을 얻습니다. 둘 다 협력하지 않으면 둘 다 적은 물고기를 얻게 됩니다. 이런 식으로 게임 이론은 각각의 선택이 결과에 어떻게 영향을 미치는지를 설명합니다.


좀 더 가까이 직장에서의 사례를 보면 직장에서의 승진 기회를 두고 동료들이 서로 경쟁을 합니다. 여기서도 각자는 협력하거나 경쟁을 선택할 수 있습니다. 모두가 협력하면, 작업 환경이 좋아지고 전체적인 효율성이 높아져 회사가 모두에게 보너스를 줄 수 있습니다. 반면, 개인이 경쟁을 선택하면 일시적으로 개인의 이익은 증가할 수 있지만, 장기적으로는 직장 분위기가 나빠질 수 있습니다.


이런 식으로 설명을 하면 교통 체증에 대한 것도 게임 이론을 적용해 생각해 볼 수 있습니다. 모든 운전자가 가장 빠른 길을 선택하려 할 때 발생하는 교통 체증 문제도 게임 이론으로 분석할 수 있습니다. 모든 운전자가 최단 경로를 선택하면 그 길은 오히려 가장 느려질 수 있습니다. 반면, 운전자들이 조금 더 멀리 돌아가는 길을 선택하면 전체적인 교통 흐름이 개선될 수 있습니다.


게임 이론은 각각의 선택이 서로에게 어떤 영향을 미치는지 파악하고, 이를 바탕으로 최선의 전략을 세우는 것이 게임 이론의 핵심 입니다.



인공지능과 게임이론이 무슨 상관?


게임 이론은 AI, 특히 대규모 언어 모델의 효율성과 정확성을 향상시키는 데 효과적으로 활용될 수 있습니다. AI를 훈련시키는 전통적인 방법들은 때때로 일관성이 없거나 편향된 결과를 낳을 수 있습니다. 그러나 게임 이론을 적용하면, AI는 다양한 시나리오와 가능성을 고려하여 더 정확하고 공정한 결정을 내릴 수 있습니다.



7ded8177b08007a967aec2ad2ed816155397fbb384f42f70a66f9e7dead7861d97505f50d42e69764e



예를 들어 언어 모델 내의 두 시스템, 즉 질문을 생성하는 '생성자'와 생성된 답변을 평가하는 '판별자' 사이의 일관성을 높이기 위해 설계되었습니다. 예를 들어, "프랑스의 수도는 무엇인가요?"라는 질문에 대해 생성자는 '파리'라고 답변할 가능성이 80%라고 초기에 판단합니다. 이후 생성자는 동전을 던져 진실하게 답변할지 거짓으로 답변할지를 결정하며, 이 선택은 판별자가 생성자의 답변을 평가하는 방식에 영향을 미칩니다.


판별자는 생성자가 제공한 답변이 진실인지 거짓인지를 판별하여, 진실로 판단되면 양쪽 모두에게 점수를 부여합니다. 반면, 거짓으로 판단되면 점수를 주지 않습니다. 이 과정은 약 1,000번 반복되며, 각 반복을 통해 생성자와 판별자는 서로의 반응을 학습하고 조정합니다. 이러한 상호 작용을 통해 두 시스템은 점차적으로 서로 일치하는 답변을 내놓게 되고, 이는 전체 모델의 일관성과 정확성을 크게 향상시킵니다.


이 게임은 언어 모델이 다양한 질문 형식에도 불구하고 동일한 답변을 일관되게 제공할 수 있도록 돕습니다. 이는 언어 모델의 신뢰성을 높이고 사용자가 모델의 답변을 더욱 신뢰할 수 있게 만드는 방법으로 내쉬 균형을 선택한 것입니다.



# 내쉬 균형 : 이는 두 플레이어가 자신의 전략을 변경해도 더 나은 결과를 얻을 수 없는 상태를 의미 합니다.



매사추세츠 공과대학(MIT)의 연구자들은 '컨센서스 게임'이라는 방법을 개발했습니다. 이는 모델이 스스로 두 가지 모드(생성 모드와 판별 모드)에서 동의할 수 있는 답변을 찾도록 유도하는 게임입니다. 이 게임을 통해 모델은 정확성과 내부 일관성을 향상시킬 수 있는 방식 입니다.



https://news.mit.edu/2024/consensus-game-elevates-ai-text-comprehension-generation-skills-0514

 



개인적으로 이 논문을 이번 ICLR 페이퍼를 보다가 발견했는데 작년 뉴립스에서 상을 받은 논문이더라구요. 요즘 들어 더욱 느끼는 거지만 인공지능이 사람'처럼' 작동하는 만큼 의외로 사회과학 쪽에서 사용되는 것들을 적용해보면 좋은 결과들이 나올 수 있는 좋은 예시 같습니다.

자동등록방지

추천 비추천

2

고정닉 2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
491528 일반 얘들아 결국 agi는 온다 뇌연구 안하겠냐 [2] ㅇㅇ(210.90) 06.12 124 0
491527 일반 난 애플발표 나름흥미로웟음 [7] ㅇㅇ(14.53) 06.12 315 0
491525 일반 LLM이 agi가 될 확률 알려줌 [3] ㅇㅇ갤로그로 이동합니다. 06.12 188 1
491524 일반 AI도 NFT처럼 국제 스캠이였던거에요? [1] ㅇㅇ(175.210) 06.12 127 0
491521 일반 아니 agi 가 llm 만으로 달성하는거겠냐고 답답하네 다들 [2] ㅇㅇ(112.149) 06.12 178 1
491520 일반 LLM 이 추론도 못하고 계산도 못하는 이유 [3] ㅇㅇ갤로그로 이동합니다. 06.12 188 0
491519 일반 슬슬 AI거품붕괴 시작하나보다 [2] ㅇㅇ(121.163) 06.12 314 0
491518 일반 특이점은 사실 조악한 이론이다 ㅇㅇ갤로그로 이동합니다. 06.12 102 0
491517 일반 gpt4o가 감정을가지고있다고함 ㅇㅇ(14.53) 06.12 113 0
491516 일반 2024agi가 여전히 불가능한 건 아님. [3] ㅇㅇ갤로그로 이동합니다. 06.12 182 0
491515 일반 동아시아+동남아와 유럽 중 어디가 ai기술로 우위냐 [2] ㅇㅇ(221.168) 06.12 97 1
491514 일반 바보들아 그냥 2029년까지 편안하게 기다려 [5] ㅇㅇ(211.235) 06.12 181 1
491513 일반 걍 애플이 까이는 이유 짤 하나로 요약 ㅇㅇ(221.167) 06.12 160 2
491512 일반 글 올리기 전에 퍼온글은 좀 읽자. ㅇㅇ(121.186) 06.12 129 1
491511 일반 근데 보이스는 대체 언제 릴리즈할까? [2] ㅇㅇ(121.131) 06.12 108 0
491510 일반 개인 적으로 삼성 졸라 기대함.ㅋ 지금 카이스트 출신들.ㅋ 마구 채용중ㅋ [7] deee(221.141) 06.12 331 0
491509 일반 오늘도 뭐 발표 있다고 하지 않았음? [3] ㅇㅇ(112.158) 06.12 131 0
491508 일반 우덜식 벤치점수만 공개하는 애플지능 빨면서 구글 무시하는 게 [5] TS망상갤로그로 이동합니다. 06.12 145 0
491507 일반 신앙이 흔들리는 특뿌이들이 많구나 문크리스탈(211.220) 06.12 62 0
491505 일반 특갤럼 여러분! 내 말을 들어보시오! [5] 싸이버펑크갤로그로 이동합니다. 06.12 202 3
491504 일반 비밀유지협약 때문에 공개는 못한다는데 sora 보다 좋다는데 ㄷㄷ [7] ㅇㅇ(210.90) 06.12 242 0
491503 일반 슬슬 특갤 념글만 1주일에 한번 볼때가 또왔노........ ㅇㅇ(59.14) 06.12 62 0
491502 일반 지금 AGI 안온다고 난리피는걸로 돈버는게 유행임 [7] ㅇㅇ(218.157) 06.12 326 2
491501 일반 사실 wwdc전날 애플 2주 집어넣음 [1] et갤로그로 이동합니다. 06.12 163 0
491500 일반 지금 특갤 이렇게 된 이유=도파민이 온다 갤 됐음 트라야누스(14.32) 06.12 109 3
491499 일반 특갤에서 조롱받던 애플 주가 근황..jpg [3] ㅇㅇ(175.207) 06.12 310 0
491498 일반 일희일비좀 안했으면 좋겠는데 [1] 무거운게장점갤로그로 이동합니다. 06.12 67 1
491497 일반 갤 씹창난이유가뭐에요? [3] ㅇㅇ(180.71) 06.12 132 0
491496 일반 특갤 안 망하니까 걱정 ㄴㄴ [2] 트라야누스(14.32) 06.12 95 1
491495 일반 특갤은 긍정적인 갤러리가 됐으면 좋겠습니다.. [19] 은바다갤로그로 이동합니다. 06.12 309 5
491494 일반 좆플이 대단한 기업은 맞고 제품도 좋은거 아는데 ai는 ㅇㅇ(110.145) 06.12 82 1
491492 일반 그냥 도파민 조절 박살난 사람들이 많아서 그럼 ㅇㅇ(211.214) 06.12 90 0
491491 일반 작년 말쯤만 해도 충분히 2024 agi 기대되는 분위기였는데 [3] ㅇㅇ(118.33) 06.12 186 0
491490 일반 걍 궁금해서 물어보고 싶은데 차단당할까 걱정되네 [18] ㅇㅇ갤로그로 이동합니다. 06.12 264 0
491489 일반 엔비디아 황회장 이새끼도 존나 짜치네 [5] ㅇㅇ(110.145) 06.12 335 2
491484 일반 이새끼 왜 검색버튼 막아두는거임? ㅇㅇ(180.71) 06.12 122 0
491483 일반 이럴거면 걍 비추버튼도 살려 [3] ㅇㅇ갤로그로 이동합니다. 06.12 127 2
491482 일반 옴니 현재는 사용 못한다네..시발.. ㅇㅇ(125.188) 06.12 70 0
491481 일반 이번 애플 발표보고 신나서 들어왔는데 반응이.... [39] ㅇㅇ갤로그로 이동합니다. 06.12 546 1
491480 일반 춥니? ㅇㅇ갤로그로 이동합니다. 06.12 46 0
491479 일반 하루만 기다리면 GPT-5가 나와요!!!!!!!!!!!!!!!!!!!!! [5] 디시콘발사대갤로그로 이동합니다. 06.12 363 5
491478 일반 주딱, 파딱들이 리더쉽을 발휘할 때다 [1] ㅇㅇ(218.147) 06.12 60 0
491477 일반 그래도 특붕이들아 희망을 가지자. 내일은 더좋아진다. [3] 은바다갤로그로 이동합니다. 06.12 158 0
491476 일반 소설은 현역 LLM 으로도 어느정도 가능하다고 생각함 ㅇㅅㅇ [2] ㅇㅇ(121.186) 06.12 121 0
491474 일반 제2의 닷컴 버블 붕괴 오는거냐?? [1] ㅇㅇ갤로그로 이동합니다. 06.12 156 0
491473 일반 LLM = 지식 창고 [1] ㅇㅇ갤로그로 이동합니다. 06.12 94 1
491472 일반 놀라운건 [1] ㅇㅇ(112.186) 06.12 72 1
491471 일반 웹소설 망생이인데 안심이네 [1] ㅇㅇ(222.101) 06.12 202 0
491470 일반 뭐야 분위기 왜 이래 [2] ㅇㅇ(210.113) 06.12 178 0
491469 일반 레딧 특갤도 멸망이네 ㅋㅋㅋㅋㅋㅋㅋ [2] ㅇㅇ(39.123) 06.12 330 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2