"챗GPT로 게임 '레드 데드 리뎀션 2' 클리어 - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보] "챗GPT로 게임 '레드 데드 리뎀션 2' 클리어

ㅇㅇ(182.230) 2024.04.16 20:29:51

조회 2331 추천 15 댓글 14

https://www.aitimes.com/news/articleView.html?idxno=158836

AI타임스

'GPT-4V'를 활용해 화면과 사운드를 이해하고 컴퓨터 마우스와 키보드를 조작, 세밀한 조정이 필요한 게임 '레드 데드 리뎀션 2(RDR2)' 작동에 성공한 사례가 등장했다. 연구자들은 단순 게임 조작을 넘어 인공지능(AI) 에이전트로서의 가능성을 보여줬다고 설명했다.톰스하드웨어는 15일(현지시간) 중국과 싱가포르 연구진이 최근 AI로 RDR2를 플레이하도록 하는 연구 결과를 온라인 아카이브에 게재했다고 보도했다. 논문 제목은 'GCC(일반 컴퓨터 컨트롤): RDR2 플레이를 위한 멀티모달 에이전트 연구'다.GCC는 AI가 게임

www.aitimes.com

7ce8887eb68407f739ef8fe341ee71685a791e2a4cf0dc24241b41fde121f5252120

'GPT-4V'를 활용해 화면과 사운드를 이해하고 컴퓨터 마우스와 키보드를 조작, 세밀한 조정이 필요한 게임 '레드 데드 리뎀션 2(RDR2)' 작동에 성공한 사례가 등장했다. 연구자들은 단순 게임 조작을 넘어 인공지능(AI) 에이전트로서의 가능성을 보여줬다고 설명했다.

톰스하드웨어는 15일(현지시간) 중국과 싱가포르 연구진이 최근 AI로 RDR2를 플레이하도록 하는 연구 결과를 온라인 아카이브에 게재했다고 보도했다. 논문 제목은 'GCC(일반 컴퓨터 컨트롤): RDR2 플레이를 위한 멀티모달 에이전트 연구'다.

GCC는 AI가 게임 내부에 관여하거나 API를 사용하지 않고, 인간처럼 외부에서 게임을 관찰하고 플레이하는 방식을 말한다.

이를 가능하게 하기 위해 비전 기능과 음성 인식이 가능한 GPT-4V를 활용했다. 또 GPT-4V를 게임과 연결하고 컨트롤할 수 있도록 '크래들(CRADLE)'이라는 6개의 모듈 에이전트를 동원했다.

연구원들은 RDR2를 대상으로 한 것에 대해 "가장 까다로운 컴퓨터 작업을 대표하고, 그런 가상 환경에서 우리 프레임워크의 성능 경계를 평가할 수 있게 해주는 복잡한 블랙박스 제어 시스템을 가지고 있다"라고 이유를 밝혔다.

실제로 이 게임은 플레이어가 탐색할 수 있는 풍부한 환경과 다양한 상황을 제공한다. 또 대화, 고유 아이콘, 게임 내 프롬프트 및 지침과 같은 UI 요소를 갖추고 있어, AI 학습에 좋다는 평이다.

또 연구원들은 AI의 마우스와 키보드 작동이 다른 소프트웨어보다 GCC에 더 효과적이라고 밝혔다.

7ce8887eb68407f739ef8fe34eee716b4188d1f22f0d39c5d01cd2d62c8156de7ae4

그 결과 연구진은 크래들이 RDR2의 주요 스토리라인에 따라 세계를 탐색하고 미션을 완료하며 게임을 진행했다고 밝혔다. 메인 스토리라인은 물론 개방형 미션의 대표적인 과제까지 마쳤다는 설명이다. 특히 "크래들은 메인 스토리라인의 모든 작업을 일관되게 완료할 수 있다"라고 주장했다.

하지만 빠르게 진행되는 총격전이나 복잡한 실내를 탐색하는 미션, 긴 지평선이 있는 개방형 탐색 등에서는 어려움을 겪은 것으로 알려졌다. 이런 문제 중 일부는 GPT4-V의 탓이라고 밝혔다. 즉 "GPT-4V의 공간-시각 인식 능력은 정밀하고 세밀한 제어를 하기에는 부족하다”라는 주장이다.

또 GPT4-V는 게임 내 고유 아이콘 등 영역별 개념과 미니맵 이해, 일반적인 장애물 등을 파악하는 데 애를 먹었다고 전했다.

이번 연구 결과는 향후 도입될 AI 에이전트와 밀접한 연관이 있다. AI 에이전트는 사람을 대신해 마우스와 키보드를 사용해 웹을 탐색하고 각종 애플리케이션을 조작해야 하기 때문이다.

또 AI 에이전트의 원활한 작동을 위해서는 추론 능력은 물론 비전 기능이 더 정교해져야 한다는 것을 강조했다.

고정닉 9

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2861	설문	어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는?	운영자	24/05/20	-	-
461605	일반	이름가지고 장난치는거 보니까 슬슬 끝물같으면 개추ㅋㅋㅋ [5]	ㅇㅇ(211.197)	05.01	4235	40
461548	일반	GPT2에 대한 가장 그럴듯한 설명 [34]	모브	04.30	3490	30
461546	일반	S 곡선 끄트머리 같으면 개추 [13]	ㅇㅇ(112.165)	04.30	3407	35
461511	정보	찍이점) 심장 미세환경까지 구현한 미니 장기 ‘오가노이드’ 나왔다 [5]	ㅇㅇ(182.230)	04.30	1794	24
461505	정보	영상의 디테일을 부활시키며 업스케일하는 AI ‘Video GigaGAN’ [20]	ㅇㅇ(182.230)	04.30	2804	23
461494	일반	gpt2 최신 갤떡밥 요약.jpg [11]	ㅇㅇ(218.155)	04.30	4816	32
461362	일반	GPT2 ㄹㅇ 퀀텀점프 아니냐 ㄷㄷㄷ [26]	ㅇㅇ	04.30	4768	41
363468	일반	고전) 특갤 문학 고전 명작 모음집 [20]	ㅇㅇ(61.84)	23.10.15	5328	72
461177	일반	gpt2-chatbot 써보는 방법 [8]	ㅇㅇㅇ(1.220)	04.30	4108	26
461021	일반	간단하지만 어려운 추론 문제로 LLM들의 성능을 알아보자 [24]	ㅇㅇ(106.102)	04.30	2632	20
461011	일반	애초에 '환각'이라는 표현부터가 이상함 [33]	ㅇㅇ(121.173)	04.30	3149	18
461007	일반	오늘자 오픈AI 트윗 말장난 [16]	모브	04.30	3354	26
460981	일반	OpenAI 개발자 플랫폼 새로운 기능 추가 [15]	ㅇㅇ(112.144)	04.30	3115	25
460951	일반	보스턴다이나믹스 신규영상 [19]	ㅇㅇ(125.183)	04.30	2958	23
460872	일반	근데 왜 미국애들은 새벽에 뭐 발표함?? [23]	lightvector	04.29	3183	31
460861	일반	속보) GPT 올해의 가장 큰 업데이트 발표 [13]	ㅇㅇ	04.29	4163	27
460815	일반	응 gpt5 나와 이 병신들아 [21]	ㅇㅇ	04.29	3112	33
460811	일반	오늘 그냥 잘꺼면 개추 ㅋㅋ [15]	ㅇㅇ(58.29)	04.29	1742	43
460748	일반	내일 무조건 GPT-5 나오는 이유 5가지.jpg [19]	ㅇㅇ(182.230)	04.29	3089	27
460726	정보	또 등장한 '소라'의 한계 지적..."영화 제작은 시기상조" [13]	ㅇㅇ(182.230)	04.29	516	13
460686	정보	깃허브 개발자 "내일 큰 거 온다" [20]	ㅇㅇ(125.191)	04.29	3212	26
460658	정보	제미니 울트라 1.5 [13]	ㅇㅇ(125.191)	04.29	936	15
460650	정보	국내 직장인 셋 중 하나 "생성형 AI 10년 안에 내 업무 대체할 것" [13]	ㅇㅇ(125.191)	04.29	2431	28
460611	정보	2024년 AI 스타트업을 위한 데이터 수집 전략 [3]	ㅇㅇ(182.230)	04.29	1583	21
460626	일반	자본주의는 망해야 함 [24]	ㅇㅇ(58.29)	04.29	1838	34
460621	일반	무어의 법칙 이번에는 진짜 끝났다!! 발전 좆됐다!!! [35]	lightvector	04.29	3041	35
460600	정보	Qwen1.5-110B : 알리바바의 오픈소스 LLM Qwen1.5 [4]	ㅇㅇ(182.230)	04.29	733	21
460599	정보	Meta Llama 3 발표후, 첫 일주일간 생긴 일 [2]	ㅇㅇ(182.230)	04.29	1431	26
460583	정보	Figure 60 Minutes 영상 [14]	ㅇㅇ(125.191)	04.29	1112	16
460574	정보	중국의 AI 혁신으로 의사보다 두 배 빠른 속도로 식도암 병변 식별 [6]	ㅇㅇ	04.29	832	17
460165	정보	터미네이터 감독 "AI가 날 대신할 수도…배우는 대체 못 해" [7]	lightvector	04.27	1595	16
460448	정보	사람 음성 받아적는 AI도 '환각' 보여…"없는 말 지어내" [11]	ㅇㅇ(182.230)	04.28	933	15
460400	일반	나도 한명 저격해도 되냐 ㅅㅂ [5]	ㅇㅇ(14.53)	04.28	3025	30
460365	정보	르쿤이형 : 현재 LLM은 여전히 꽤 멍청. 인간수준 못넘을 것 [25]	ㅇㅇ(119.77)	04.28	3181	41
460363	정보	MS Copilot, 사용자 PC 파일 제어 기능 추가 [7]	ㅇㅇ(119.77)	04.28	716	24
460334	일반	근데 진짜 념글처럼 ai겨울인거 맞지 않음? [31]	ㅇㅇ(112.218)	04.28	2809	18
460332	일반	구글 방금 파이썬팀 해고 [39]	ㅇㅇ(125.191)	04.28	3921	21
460316	일반	최근 AI 근황 요약 [33]	ㅇㅇ(218.150)	04.28	4896	58
460315	일반	무뚝뚝한 안드로이드 메이드.manhwa [14]	ㅇㅇ(125.241)	04.28	2160	39
460264	일반	데이비드 샤피로 "올해 1억개의 일자리를 파괴할 gpt-5 agi 기대" [19]	ㅇㅇ(125.191)	04.28	2713	19
460262	일반	양놈들이 보는 'AI 인플루언서' 특 [9]	ㅇㅇ(116.124)	04.28	2930	51
460245	일반	학벌이 뭐가 중요할까요 [36]	좋아해킨드	04.28	3020	29
460233	일반	이새끼들 대학타령 하고 있네 [12]	ㅇㅇ(58.29)	04.28	1985	20
460201	정보	어도비, '파이어플라이 이미지 3' 출시...'포토샵'에 생성 AI 통합 [3]	ㅇㅇ(182.230)	04.28	1229	15
460139	일반	클린 념글 보는 법 [8]	SMN	04.27	1807	28
460091	정보	OpenAI 소라 경쟁 Vidu 출시 [23]	선갤러(125.191)	04.27	2575	28
460089	일반	독일 재생에너지 50% 넘음 [21]	ㅇㅇ(220.73)	04.27	1187	16
460088	정보	전 FDA 국장 "생명공학의 변곡점이 오고 있다" [23]	선갤러(125.191)	04.27	3386	35
460036	정보	애플, 오픈AI와 협상 재개...'시리'에 '챗GPT' 통합 추진할 듯 [12]	ㅇㅇ(182.230)	04.27	598	12
460011	일반	국내연구진은 거른다면서 [48]	ㅇㅇ(114.205)	04.27	3129	74