게임 이론이 인공지능의 정확성과 효율성을 향상시키는 방법

ㅇㅇ · 2024.05.18 20:35:07

https://slashpage.com/haebom/7916x82rqpqqpm4kpyg3

게임 이론이 인공지능의 정확성과 효율성을 향상시키는 방법 - 해봄의 잡동사니

게임 이론은 사람들이나 조직들이 어떤 상황에서 어떻게 결정을 내리는지를 연구하는 수학적 이론입니다. 이 이론은 각 개인이나 그룹이 자신의 이익을 최대화하기 위해 어떻게 행동하는지, 그리고 그러한 행동이 다른 사람들의 선택과 어떻게 상호 작용하는지를 분석합니다. 즉, 게임 이론은 다른 사람들의 선택에 영향을 받는 상황에서 최적의 결정을 찾는 방법을 연구합니다...

slashpage.com

게임 이론은 사람들이나 조직들이 어떤 상황에서 어떻게 결정을 내리는지를 연구하는 수학적 이론입니다. 이 이론은 각 개인이나 그룹이 자신의 이익을 최대화하기 위해 어떻게 행동하는지, 그리고 그러한 행동이 다른 사람들의 선택과 어떻게 상호 작용하는지를 분석합니다. 즉, 게임 이론은 다른 사람들의 선택에 영향을 받는 상황에서 최적의 결정을 찾는 방법을 연구합니다. 이렇게 말하면 어렵게 느껴질 수 있습니다만 예시를 몇가지 들어보죠.

7ded8276b68507a9459ae58c0fc22f1304c1bfdda8ec97c6e77e22f25878370332f39a57dedd39c1c4

사실 죄수의 딜레마로 설명되는 이론이기도 합니다. 이 상황의 경우 A와 B는 서로 정보교환을 할 수 없는 독립된 환경에 있어야 한다는 걸 전재로 합니다.

돌고래와 고래가 서로 협력해서 더 많은 물고기를 잡으려고 합니다. 이들 각각은 협력하거나 협력하지 않을 수 있는 선택을 할 수 있습니다. 돌고래와 고래 모두 협력하면 둘 다 많은 물고기를 얻을 수 있습니다. 하지만 한 쪽만 협력하고 다른 한 쪽은 협력하지 않으면, 협력하지 않은 쪽이 더 많은 이득을 얻습니다. 둘 다 협력하지 않으면 둘 다 적은 물고기를 얻게 됩니다. 이런 식으로 게임 이론은 각각의 선택이 결과에 어떻게 영향을 미치는지를 설명합니다.

좀 더 가까이 직장에서의 사례를 보면 직장에서의 승진 기회를 두고 동료들이 서로 경쟁을 합니다. 여기서도 각자는 협력하거나 경쟁을 선택할 수 있습니다. 모두가 협력하면, 작업 환경이 좋아지고 전체적인 효율성이 높아져 회사가 모두에게 보너스를 줄 수 있습니다. 반면, 개인이 경쟁을 선택하면 일시적으로 개인의 이익은 증가할 수 있지만, 장기적으로는 직장 분위기가 나빠질 수 있습니다.

이런 식으로 설명을 하면 교통 체증에 대한 것도 게임 이론을 적용해 생각해 볼 수 있습니다. 모든 운전자가 가장 빠른 길을 선택하려 할 때 발생하는 교통 체증 문제도 게임 이론으로 분석할 수 있습니다. 모든 운전자가 최단 경로를 선택하면 그 길은 오히려 가장 느려질 수 있습니다. 반면, 운전자들이 조금 더 멀리 돌아가는 길을 선택하면 전체적인 교통 흐름이 개선될 수 있습니다.

게임 이론은 각각의 선택이 서로에게 어떤 영향을 미치는지 파악하고, 이를 바탕으로 최선의 전략을 세우는 것이 게임 이론의 핵심 입니다.

인공지능과 게임이론이 무슨 상관?

게임 이론은 AI, 특히 대규모 언어 모델의 효율성과 정확성을 향상시키는 데 효과적으로 활용될 수 있습니다. AI를 훈련시키는 전통적인 방법들은 때때로 일관성이 없거나 편향된 결과를 낳을 수 있습니다. 그러나 게임 이론을 적용하면, AI는 다양한 시나리오와 가능성을 고려하여 더 정확하고 공정한 결정을 내릴 수 있습니다.

7ded8177b08007a967aec2ad2ed816155397fbb384f42f70a66f9e7dead7861d97505f50d42e69764e

예를 들어 언어 모델 내의 두 시스템, 즉 질문을 생성하는 '생성자'와 생성된 답변을 평가하는 '판별자' 사이의 일관성을 높이기 위해 설계되었습니다. 예를 들어, "프랑스의 수도는 무엇인가요?"라는 질문에 대해 생성자는 '파리'라고 답변할 가능성이 80%라고 초기에 판단합니다. 이후 생성자는 동전을 던져 진실하게 답변할지 거짓으로 답변할지를 결정하며, 이 선택은 판별자가 생성자의 답변을 평가하는 방식에 영향을 미칩니다.

판별자는 생성자가 제공한 답변이 진실인지 거짓인지를 판별하여, 진실로 판단되면 양쪽 모두에게 점수를 부여합니다. 반면, 거짓으로 판단되면 점수를 주지 않습니다. 이 과정은 약 1,000번 반복되며, 각 반복을 통해 생성자와 판별자는 서로의 반응을 학습하고 조정합니다. 이러한 상호 작용을 통해 두 시스템은 점차적으로 서로 일치하는 답변을 내놓게 되고, 이는 전체 모델의 일관성과 정확성을 크게 향상시킵니다.

이 게임은 언어 모델이 다양한 질문 형식에도 불구하고 동일한 답변을 일관되게 제공할 수 있도록 돕습니다. 이는 언어 모델의 신뢰성을 높이고 사용자가 모델의 답변을 더욱 신뢰할 수 있게 만드는 방법으로 내쉬 균형을 선택한 것입니다.

# 내쉬 균형 : 이는 두 플레이어가 자신의 전략을 변경해도 더 나은 결과를 얻을 수 없는 상태를 의미 합니다.

매사추세츠 공과대학(MIT)의 연구자들은 '컨센서스 게임'이라는 방법을 개발했습니다. 이는 모델이 스스로 두 가지 모드(생성 모드와 판별 모드)에서 동의할 수 있는 답변을 찾도록 유도하는 게임입니다. 이 게임을 통해 모델은 정확성과 내부 일관성을 향상시킬 수 있는 방식 입니다.

https://news.mit.edu/2024/consensus-game-elevates-ai-text-comprehension-generation-skills-0514

Using ideas from game theory to improve the reliability of language models

A new "consensus game," an MIT-developed game-theoretic procedure for decoding language models, enhances text generation by converging generative and discriminative querying into coherent predictions.

news.mit.edu

개인적으로 이 논문을 이번 ICLR 페이퍼를 보다가 발견했는데 작년 뉴립스에서 상을 받은 논문이더라구요. 요즘 들어 더욱 느끼는 거지만 인공지능이 사람'처럼' 작동하는 만큼 의외로 사회과학 쪽에서 사용되는 것들을 적용해보면 좋은 결과들이 나올 수 있는 좋은 예시 같습니다.

번호	말머리	제목	글쓴이	작성일	조회	추천
2863	설문	시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는?	운영자	24/05/27	-	-
412470	공지	레이 커즈와일 신간 6월 25일 발매 [29]	모브	24.01.24	8006	33
242613	공지	특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3180]	*특갤용*	23.08.06	39481	43
433260	공지	웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [2]	*부패하는유전자!!!*	24.03.06	2582	2
363220	공지	선형글 삭제 기준 [7]	*특갤용*	23.10.14	7267	24
375493	공지	필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40]	ㅇㅇ(182.230)	23.11.11	13384	122
373402	공지	직업 비하, 조롱 글 30일 차단됩니다. [51]	*특갤용*	23.11.07	8965	79
385147	공지	구글의 AGI 분류 체계 [17]	ㅇㅇ	23.11.22	8410	31
332612	공지	음모론 삭제 기준을 안내드립니다. [23]	*특갤용*	23.08.25	9177	30
259237	공지	특갤 용어 모음집 [6]	*특갤용*	23.08.09	22772	33
485282	일반	진짜 좀만 있으면 확확 바뀔꺼 같지않냐	ㅇㅇ(106.101)	08:11	52	0
485281	일반	근데 지금 시대를 살아가는 입장에서 [2]	ㅇㅇ(106.101)	08:07	42	0
485280	일반	미래엔 일을 가상현실에서 할듯 [3]	ㅇㅇ(125.180)	07:47	77	2
485278	일반	챗지피티랑 음성대화 첨해봄 [5]	우웅	07:36	123	2
485277	일반	근데 나중에 기억복제가 완전히 가능해진다면	ㅇㅇ(175.201)	07:21	44	1
485276	일반	그러고보니 SD3은 왜 소식이 읎냐... [2]	ㅇㅇ(223.38)	07:17	59	1
485275	일반	현실적으로 보이스모드나 나오길 빌어라 [2]	chatgpt4o	07:17	65	0
485273	AI창 AI창작	이미지 생성 AI 3대장이.. [4]	ㅇㅇ(211.211)	06:40	179	0
485272	일반	6월 6일에 큰거 온다!!! [5]	ㅇㅇ	06:02	320	1
485271	일반	클로바노트급으로 음성인식 잘하는거 없냐? [3]	ㅇㄴㅁㅇ(124.48)	05:39	64	0
485270	일반	트윗질이 다 맞았으면ㅇ [2]	ㅇㅇ(180.66)	04:27	137	0
485269	정보/ 정보/뉴스	우주인 고산 CBS에 나와서 특이점 대학 얘기함 [4]	ㅇㅇ	04:06	275	1
485268	일반	세포 리프로그래밍이 ISP로만 하는건지?	ㅇㅇ(211.234)	03:53	75	0
485263	일반	Feeling the AGI today ♥ [3]	ㅇㅇ	03:27	289	0
485261	일반	AI 발전속도 요약 [3]	부동의제국	03:21	467	0
485258	일반	암도 백신으로 예방하는 시대 열리나? 영국 내년에 수천 명 임상 [4]	이가나라	02:59	220	0
485255	정보/ 정보/뉴스	AI 도구로 환자를 효과적인 항우울제와 더 빠르게 매칭 [5]	ㅇㅇ	02:46	194	0
485252	일반	현재 ai 모델들 특성이 뇌에서 발견되는 현상이랑 비슷하데 [4]	ㅇㅇ	02:41	257	0
485250	일반	키수술같은건 어떻게 생각함 [7]	ㅇㅇ(110.9)	02:30	220	0
485249	일반	특갤 차단 기준이 궁금하네 [5]	ㅇㅇ(175.213)	02:18	173	1
485245	일반	Gpt5가 곧 옵니다 [3]	ㅇㅇ(58.29)	02:09	478	0
485244	일반	해병문학 번역하는데 이건 무슨뜻임 [12]	<:)~	02:07	252	0
485243	일반	미래꽃 이시발련은 [3]	ㅇㅇ(117.111)	02:00	219	0
485242	일반	진짜 자기계발이고 뭐고 뭘 할 의욕이 안난다 [11]	ㅇㅇ	01:58	287	0
485241	일반	좀있으면 나온다네 [5]	ㅇㅇ	01:48	422	0
485239	일반	AGI 나오면 지금 TSMC 3nm 칩도 싸구려 될까봐 뭔가 심란해 [20]	은바다	01:33	445	2
485238	일반	알트만햄이랑 oai가 호감인게 [1]	ㅇㅇ(211.116)	01:19	135	0
485237	일반	gpt 현재버전으론 다들 만족 못하지? [10]	ㅇㅇ(125.141)	01:06	313	0
485236	일반	차세대 시리 질문 [13]	ㅇㅇ(39.121)	01:01	163	0
485235	일반	메스가키GPT 시스템 프롬프트 까봄 [7]	Ad_Astra	00:58	358	3
485234	일반	6월6일 뭐 잇으면 [1]	ㅇㅇ(39.124)	00:56	202	0
485233	일반	메스가키GPT 이새끼진짜 뭐지 [13]	엉터리만화가	00:53	552	3
485232	일반	6월6일 특갤 좆창날꺼 같으면 개추 ㅋㅋㅋ [6]	ㅇㅇ(58.29)	00:35	622	15
485231	일반	코파일럿 점마 이거 와이라노 [2]	ㅇㅇ(211.227)	00:30	185	0
485230	일반	새벽에 뭐 이벤트 있나요?? [4]	오바도쥬	00:23	318	0
485229	일반	이 노래랑 뮤비 보면	엉터리만화가	00:18	48	0
485228	일반	특이점이 오면 인류는 멸망할 것 같은데 [6]	ㅇㅇ(125.183)	00:14	269	0
485227	일반	새벽3시충들 처내 [9]	ㅇㅇ	00:12	265	1
485226	일반	4o 무료는 이미 전에 풀렸잖아	ㅇㅇ	00:11	111	0
485225	일반	메스가키GPTs랑 통화할수있으면 [2]	엉터리만화가	00:11	150	0
485224	일반	아니 갑자기 왜 6월 6일 떡밥임? [5]	ㅇㅇ	00:09	377	0

최근 방문

즐겨찾기

즐겨찾기 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

마이너 갤러리 소개

차단하기

[특이점이 온다 갤러리]

갤러리 본문 영역

게시물을 간편하게 NFT로 만들어 보세요!

NFT 발행 방법

NFT 발행

비회원 글삭제,수정

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘

지갑 연결