게임 이론이 인공지능의 정확성과 효율성을 향상시키는 방법

ㅇㅇ · 2024.05.18 20:35:07

https://slashpage.com/haebom/7916x82rqpqqpm4kpyg3

게임 이론이 인공지능의 정확성과 효율성을 향상시키는 방법 - 해봄의 잡동사니

게임 이론은 사람들이나 조직들이 어떤 상황에서 어떻게 결정을 내리는지를 연구하는 수학적 이론입니다. 이 이론은 각 개인이나 그룹이 자신의 이익을 최대화하기 위해 어떻게 행동하는지, 그리고 그러한 행동이 다른 사람들의 선택과 어떻게 상호 작용하는지를 분석합니다. 즉, 게임 이론은 다른 사람들의 선택에 영향을 받는 상황에서 최적의 결정을 찾는 방법을 연구합니다...

slashpage.com

게임 이론은 사람들이나 조직들이 어떤 상황에서 어떻게 결정을 내리는지를 연구하는 수학적 이론입니다. 이 이론은 각 개인이나 그룹이 자신의 이익을 최대화하기 위해 어떻게 행동하는지, 그리고 그러한 행동이 다른 사람들의 선택과 어떻게 상호 작용하는지를 분석합니다. 즉, 게임 이론은 다른 사람들의 선택에 영향을 받는 상황에서 최적의 결정을 찾는 방법을 연구합니다. 이렇게 말하면 어렵게 느껴질 수 있습니다만 예시를 몇가지 들어보죠.

7ded8276b68507a9459ae58c0fc22f1304c1bfdda8ec97c6e77e22f25878370332f39a57dedd39c1c4

사실 죄수의 딜레마로 설명되는 이론이기도 합니다. 이 상황의 경우 A와 B는 서로 정보교환을 할 수 없는 독립된 환경에 있어야 한다는 걸 전재로 합니다.

돌고래와 고래가 서로 협력해서 더 많은 물고기를 잡으려고 합니다. 이들 각각은 협력하거나 협력하지 않을 수 있는 선택을 할 수 있습니다. 돌고래와 고래 모두 협력하면 둘 다 많은 물고기를 얻을 수 있습니다. 하지만 한 쪽만 협력하고 다른 한 쪽은 협력하지 않으면, 협력하지 않은 쪽이 더 많은 이득을 얻습니다. 둘 다 협력하지 않으면 둘 다 적은 물고기를 얻게 됩니다. 이런 식으로 게임 이론은 각각의 선택이 결과에 어떻게 영향을 미치는지를 설명합니다.

좀 더 가까이 직장에서의 사례를 보면 직장에서의 승진 기회를 두고 동료들이 서로 경쟁을 합니다. 여기서도 각자는 협력하거나 경쟁을 선택할 수 있습니다. 모두가 협력하면, 작업 환경이 좋아지고 전체적인 효율성이 높아져 회사가 모두에게 보너스를 줄 수 있습니다. 반면, 개인이 경쟁을 선택하면 일시적으로 개인의 이익은 증가할 수 있지만, 장기적으로는 직장 분위기가 나빠질 수 있습니다.

이런 식으로 설명을 하면 교통 체증에 대한 것도 게임 이론을 적용해 생각해 볼 수 있습니다. 모든 운전자가 가장 빠른 길을 선택하려 할 때 발생하는 교통 체증 문제도 게임 이론으로 분석할 수 있습니다. 모든 운전자가 최단 경로를 선택하면 그 길은 오히려 가장 느려질 수 있습니다. 반면, 운전자들이 조금 더 멀리 돌아가는 길을 선택하면 전체적인 교통 흐름이 개선될 수 있습니다.

게임 이론은 각각의 선택이 서로에게 어떤 영향을 미치는지 파악하고, 이를 바탕으로 최선의 전략을 세우는 것이 게임 이론의 핵심 입니다.

인공지능과 게임이론이 무슨 상관?

게임 이론은 AI, 특히 대규모 언어 모델의 효율성과 정확성을 향상시키는 데 효과적으로 활용될 수 있습니다. AI를 훈련시키는 전통적인 방법들은 때때로 일관성이 없거나 편향된 결과를 낳을 수 있습니다. 그러나 게임 이론을 적용하면, AI는 다양한 시나리오와 가능성을 고려하여 더 정확하고 공정한 결정을 내릴 수 있습니다.

7ded8177b08007a967aec2ad2ed816155397fbb384f42f70a66f9e7dead7861d97505f50d42e69764e

예를 들어 언어 모델 내의 두 시스템, 즉 질문을 생성하는 '생성자'와 생성된 답변을 평가하는 '판별자' 사이의 일관성을 높이기 위해 설계되었습니다. 예를 들어, "프랑스의 수도는 무엇인가요?"라는 질문에 대해 생성자는 '파리'라고 답변할 가능성이 80%라고 초기에 판단합니다. 이후 생성자는 동전을 던져 진실하게 답변할지 거짓으로 답변할지를 결정하며, 이 선택은 판별자가 생성자의 답변을 평가하는 방식에 영향을 미칩니다.

판별자는 생성자가 제공한 답변이 진실인지 거짓인지를 판별하여, 진실로 판단되면 양쪽 모두에게 점수를 부여합니다. 반면, 거짓으로 판단되면 점수를 주지 않습니다. 이 과정은 약 1,000번 반복되며, 각 반복을 통해 생성자와 판별자는 서로의 반응을 학습하고 조정합니다. 이러한 상호 작용을 통해 두 시스템은 점차적으로 서로 일치하는 답변을 내놓게 되고, 이는 전체 모델의 일관성과 정확성을 크게 향상시킵니다.

이 게임은 언어 모델이 다양한 질문 형식에도 불구하고 동일한 답변을 일관되게 제공할 수 있도록 돕습니다. 이는 언어 모델의 신뢰성을 높이고 사용자가 모델의 답변을 더욱 신뢰할 수 있게 만드는 방법으로 내쉬 균형을 선택한 것입니다.

# 내쉬 균형 : 이는 두 플레이어가 자신의 전략을 변경해도 더 나은 결과를 얻을 수 없는 상태를 의미 합니다.

매사추세츠 공과대학(MIT)의 연구자들은 '컨센서스 게임'이라는 방법을 개발했습니다. 이는 모델이 스스로 두 가지 모드(생성 모드와 판별 모드)에서 동의할 수 있는 답변을 찾도록 유도하는 게임입니다. 이 게임을 통해 모델은 정확성과 내부 일관성을 향상시킬 수 있는 방식 입니다.

https://news.mit.edu/2024/consensus-game-elevates-ai-text-comprehension-generation-skills-0514

Using ideas from game theory to improve the reliability of language models

A new "consensus game," an MIT-developed game-theoretic procedure for decoding language models, enhances text generation by converging generative and discriminative querying into coherent predictions.

news.mit.edu

개인적으로 이 논문을 이번 ICLR 페이퍼를 보다가 발견했는데 작년 뉴립스에서 상을 받은 논문이더라구요. 요즘 들어 더욱 느끼는 거지만 인공지능이 사람'처럼' 작동하는 만큼 의외로 사회과학 쪽에서 사용되는 것들을 적용해보면 좋은 결과들이 나올 수 있는 좋은 예시 같습니다.

번호	말머리	제목	글쓴이	작성일	조회	추천
2872	설문	연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은?	운영자	24/06/17	-	-
491528	일반	얘들아 결국 agi는 온다 뇌연구 안하겠냐 [2]	ㅇㅇ(210.90)	06.12	124	0
491527	일반	난 애플발표 나름흥미로웟음 [7]	ㅇㅇ(14.53)	06.12	315	0
491525	일반	LLM이 agi가 될 확률 알려줌 [3]	ㅇㅇ	06.12	188	1
491524	일반	AI도 NFT처럼 국제 스캠이였던거에요? [1]	ㅇㅇ(175.210)	06.12	127	0
491521	일반	아니 agi 가 llm 만으로 달성하는거겠냐고 답답하네 다들 [2]	ㅇㅇ(112.149)	06.12	178	1
491520	일반	LLM 이 추론도 못하고 계산도 못하는 이유 [3]	ㅇㅇ	06.12	188	0
491519	일반	슬슬 AI거품붕괴 시작하나보다 [2]	ㅇㅇ(121.163)	06.12	314	0
491518	일반	특이점은 사실 조악한 이론이다	ㅇㅇ	06.12	102	0
491517	일반	gpt4o가 감정을가지고있다고함	ㅇㅇ(14.53)	06.12	113	0
491516	일반	2024agi가 여전히 불가능한 건 아님. [3]	ㅇㅇ	06.12	182	0
491515	일반	동아시아+동남아와 유럽 중 어디가 ai기술로 우위냐 [2]	ㅇㅇ(221.168)	06.12	97	1
491514	일반	바보들아 그냥 2029년까지 편안하게 기다려 [5]	ㅇㅇ(211.235)	06.12	181	1
491513	일반	걍 애플이 까이는 이유 짤 하나로 요약	ㅇㅇ(221.167)	06.12	160	2
491512	일반	글 올리기 전에 퍼온글은 좀 읽자.	ㅇㅇ(121.186)	06.12	129	1
491511	일반	근데 보이스는 대체 언제 릴리즈할까? [2]	ㅇㅇ(121.131)	06.12	108	0
491510	일반	개인 적으로 삼성 졸라 기대함.ㅋ 지금 카이스트 출신들.ㅋ 마구 채용중ㅋ [7]	deee(221.141)	06.12	331	0
491509	일반	오늘도 뭐 발표 있다고 하지 않았음? [3]	ㅇㅇ(112.158)	06.12	131	0
491508	일반	우덜식 벤치점수만 공개하는 애플지능 빨면서 구글 무시하는 게 [5]	TS망상	06.12	145	0
491507	일반	신앙이 흔들리는 특뿌이들이 많구나	문크리스탈(211.220)	06.12	62	0
491505	일반	특갤럼 여러분! 내 말을 들어보시오! [5]	싸이버펑크	06.12	202	3
491504	일반	비밀유지협약 때문에 공개는 못한다는데 sora 보다 좋다는데 ㄷㄷ [7]	ㅇㅇ(210.90)	06.12	242	0
491503	일반	슬슬 특갤 념글만 1주일에 한번 볼때가 또왔노........	ㅇㅇ(59.14)	06.12	62	0
491502	일반	지금 AGI 안온다고 난리피는걸로 돈버는게 유행임 [7]	ㅇㅇ(218.157)	06.12	326	2
491501	일반	사실 wwdc전날 애플 2주 집어넣음 [1]	et	06.12	163	0
491500	일반	지금 특갤 이렇게 된 이유=도파민이 온다 갤 됐음	트라야누스(14.32)	06.12	109	3
491499	일반	특갤에서 조롱받던 애플 주가 근황..jpg [3]	ㅇㅇ(175.207)	06.12	310	0
491498	일반	일희일비좀 안했으면 좋겠는데 [1]	무거운게장점	06.12	67	1
491497	일반	갤 씹창난이유가뭐에요? [3]	ㅇㅇ(180.71)	06.12	132	0
491496	일반	특갤 안 망하니까 걱정 ㄴㄴ [2]	트라야누스(14.32)	06.12	95	1
491495	일반	특갤은 긍정적인 갤러리가 됐으면 좋겠습니다.. [19]	은바다	06.12	309	5
491494	일반	좆플이 대단한 기업은 맞고 제품도 좋은거 아는데 ai는	ㅇㅇ(110.145)	06.12	82	1
491492	일반	그냥 도파민 조절 박살난 사람들이 많아서 그럼	ㅇㅇ(211.214)	06.12	90	0
491491	일반	작년 말쯤만 해도 충분히 2024 agi 기대되는 분위기였는데 [3]	ㅇㅇ(118.33)	06.12	186	0
491490	일반	걍 궁금해서 물어보고 싶은데 차단당할까 걱정되네 [18]	ㅇㅇ	06.12	264	0
491489	일반	엔비디아 황회장 이새끼도 존나 짜치네 [5]	ㅇㅇ(110.145)	06.12	335	2
491484	일반	이새끼 왜 검색버튼 막아두는거임?	ㅇㅇ(180.71)	06.12	122	0
491483	일반	이럴거면 걍 비추버튼도 살려 [3]	ㅇㅇ	06.12	127	2
491482	일반	옴니 현재는 사용 못한다네..시발..	ㅇㅇ(125.188)	06.12	70	0
491481	일반	이번 애플 발표보고 신나서 들어왔는데 반응이.... [39]	ㅇㅇ	06.12	546	1
491480	일반	춥니?	ㅇㅇ	06.12	46	0
491479	일반	하루만 기다리면 GPT-5가 나와요!!!!!!!!!!!!!!!!!!!!! [5]	디시콘발사대	06.12	363	5
491478	일반	주딱, 파딱들이 리더쉽을 발휘할 때다 [1]	ㅇㅇ(218.147)	06.12	60	0
491477	일반	그래도 특붕이들아 희망을 가지자. 내일은 더좋아진다. [3]	은바다	06.12	158	0
491476	일반	소설은 현역 LLM 으로도 어느정도 가능하다고 생각함 ㅇㅅㅇ [2]	ㅇㅇ(121.186)	06.12	121	0
491474	일반	제2의 닷컴 버블 붕괴 오는거냐?? [1]	ㅇㅇ	06.12	156	0
491473	일반	LLM = 지식 창고 [1]	ㅇㅇ	06.12	94	1
491472	일반	놀라운건 [1]	ㅇㅇ(112.186)	06.12	72	1
491471	일반	웹소설 망생이인데 안심이네 [1]	ㅇㅇ(222.101)	06.12	202	0
491470	일반	뭐야 분위기 왜 이래 [2]	ㅇㅇ(210.113)	06.12	178	0
491469	일반	레딧 특갤도 멸망이네 ㅋㅋㅋㅋㅋㅋㅋ [2]	ㅇㅇ(39.123)	06.12	330	0

최근 방문

즐겨찾기

즐겨찾기 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

마이너 갤러리 소개

차단하기

[특이점이 온다 갤러리]

갤러리 본문 영역

게시물을 간편하게 NFT로 만들어 보세요!

NFT 발행 방법

NFT 발행

비회원 글삭제,수정

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘

지갑 연결