디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] "챗GPT로 게임 '레드 데드 리뎀션 2' 클리어

ㅇㅇ(182.230) 2024.04.16 20:29:51
조회 2331 추천 15 댓글 14
														

https://www.aitimes.com/news/articleView.html?idxno=158836

 



7ce8887eb68407f739ef8fe341ee71685a791e2a4cf0dc24241b41fde121f5252120



'GPT-4V'를 활용해 화면과 사운드를 이해하고 컴퓨터 마우스와 키보드를 조작, 세밀한 조정이 필요한 게임 '레드 데드 리뎀션 2(RDR2)' 작동에 성공한 사례가 등장했다. 연구자들은 단순 게임 조작을 넘어 인공지능(AI) 에이전트로서의 가능성을 보여줬다고 설명했다.


톰스하드웨어는 15일(현지시간) 중국과 싱가포르 연구진이 최근 AI로 RDR2를 플레이하도록 하는 연구 결과를 온라인 아카이브에 게재했다고 보도했다. 논문 제목은 'GCC(일반 컴퓨터 컨트롤): RDR2 플레이를 위한 멀티모달 에이전트 연구'다.


GCC는 AI가 게임 내부에 관여하거나 API를 사용하지 않고, 인간처럼 외부에서 게임을 관찰하고 플레이하는 방식을 말한다.


이를 가능하게 하기 위해 비전 기능과 음성 인식이 가능한 GPT-4V를 활용했다. 또 GPT-4V를 게임과 연결하고 컨트롤할 수 있도록 '크래들(CRADLE)'이라는 6개의 모듈 에이전트를 동원했다.


연구원들은 RDR2를 대상으로 한 것에 대해 "가장 까다로운 컴퓨터 작업을 대표하고, 그런 가상 환경에서 우리 프레임워크의 성능 경계를 평가할 수 있게 해주는 복잡한 블랙박스 제어 시스템을 가지고 있다"라고 이유를 밝혔다.


실제로 이 게임은 플레이어가 탐색할 수 있는 풍부한 환경과 다양한 상황을 제공한다. 또 대화, 고유 아이콘, 게임 내 프롬프트 및 지침과 같은 UI 요소를 갖추고 있어, AI 학습에 좋다는 평이다.


또 연구원들은 AI의 마우스와 키보드 작동이 다른 소프트웨어보다 GCC에 더 효과적이라고 밝혔다.



7ce8887eb68407f739ef8fe34eee716b4188d1f22f0d39c5d01cd2d62c8156de7ae4



그 결과 연구진은 크래들이 RDR2의 주요 스토리라인에 따라 세계를 탐색하고 미션을 완료하며 게임을 진행했다고 밝혔다. 메인 스토리라인은 물론 개방형 미션의 대표적인 과제까지 마쳤다는 설명이다. 특히 "크래들은 메인 스토리라인의 모든 작업을 일관되게 완료할 수 있다"라고 주장했다.


하지만 빠르게 진행되는 총격전이나 복잡한 실내를 탐색하는 미션, 긴 지평선이 있는 개방형 탐색 등에서는 어려움을 겪은 것으로 알려졌다. 이런 문제 중 일부는 GPT4-V의 탓이라고 밝혔다. 즉 "GPT-4V의 공간-시각 인식 능력은 정밀하고 세밀한 제어를 하기에는 부족하다”라는 주장이다.


또 GPT4-V는 게임 내 고유 아이콘 등 영역별 개념과 미니맵 이해, 일반적인 장애물 등을 파악하는 데 애를 먹었다고 전했다.


이번 연구 결과는 향후 도입될 AI 에이전트와 밀접한 연관이 있다. AI 에이전트는 사람을 대신해 마우스와 키보드를 사용해 웹을 탐색하고 각종 애플리케이션을 조작해야 하기 때문이다.


또 AI 에이전트의 원활한 작동을 위해서는 추론 능력은 물론 비전 기능이 더 정교해져야 한다는 것을 강조했다.



자동등록방지

추천 비추천

15

고정닉 9

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
461605 일반 이름가지고 장난치는거 보니까 슬슬 끝물같으면 개추ㅋㅋㅋ [5] ㅇㅇ(211.197) 05.01 4235 40
461548 일반 GPT2에 대한 가장 그럴듯한 설명 [34] 모브갤로그로 이동합니다. 04.30 3490 30
461546 일반 S 곡선 끄트머리 같으면 개추 [13] ㅇㅇ(112.165) 04.30 3407 35
461511 정보 찍이점) 심장 미세환경까지 구현한 미니 장기 ‘오가노이드’ 나왔다 [5] ㅇㅇ(182.230) 04.30 1794 24
461505 정보 영상의 디테일을 부활시키며 업스케일하는 AI ‘Video GigaGAN’ [20] ㅇㅇ(182.230) 04.30 2804 23
461494 일반 gpt2 최신 갤떡밥 요약.jpg [11] ㅇㅇ(218.155) 04.30 4816 32
461362 일반 GPT2 ㄹㅇ 퀀텀점프 아니냐 ㄷㄷㄷ [26] ㅇㅇ갤로그로 이동합니다. 04.30 4768 41
363468 일반 고전) 특갤 문학 고전 명작 모음집 [20] ㅇㅇ(61.84) 23.10.15 5328 72
461177 일반 gpt2-chatbot 써보는 방법 [8] ㅇㅇㅇ(1.220) 04.30 4108 26
461021 일반 간단하지만 어려운 추론 문제로 LLM들의 성능을 알아보자 [24] ㅇㅇ(106.102) 04.30 2632 20
461011 일반 애초에 '환각'이라는 표현부터가 이상함 [33] ㅇㅇ(121.173) 04.30 3149 18
461007 일반 오늘자 오픈AI 트윗 말장난 [16] 모브갤로그로 이동합니다. 04.30 3354 26
460981 일반 OpenAI 개발자 플랫폼 새로운 기능 추가 [15] ㅇㅇ(112.144) 04.30 3115 25
460951 일반 보스턴다이나믹스 신규영상 [19] ㅇㅇ(125.183) 04.30 2958 23
460872 일반 근데 왜 미국애들은 새벽에 뭐 발표함?? [23] lightvector갤로그로 이동합니다. 04.29 3183 31
460861 일반 속보) GPT 올해의 가장 큰 업데이트 발표 [13] ㅇㅇ갤로그로 이동합니다. 04.29 4163 27
460815 일반 응 gpt5 나와 이 병신들아 [21] ㅇㅇ갤로그로 이동합니다. 04.29 3112 33
460811 일반 오늘 그냥 잘꺼면 개추 ㅋㅋ [15] ㅇㅇ(58.29) 04.29 1742 43
460748 일반 내일 무조건 GPT-5 나오는 이유 5가지.jpg [19] ㅇㅇ(182.230) 04.29 3089 27
460726 정보 또 등장한 '소라'의 한계 지적..."영화 제작은 시기상조" [13] ㅇㅇ(182.230) 04.29 516 13
460686 정보 깃허브 개발자 "내일 큰 거 온다" [20] ㅇㅇ(125.191) 04.29 3212 26
460658 정보 제미니 울트라 1.5 [13] ㅇㅇ(125.191) 04.29 936 15
460650 정보 국내 직장인 셋 중 하나 "생성형 AI 10년 안에 내 업무 대체할 것" [13] ㅇㅇ(125.191) 04.29 2431 28
460611 정보 2024년 AI 스타트업을 위한 데이터 수집 전략 [3] ㅇㅇ(182.230) 04.29 1583 21
460626 일반 자본주의는 망해야 함 [24] ㅇㅇ(58.29) 04.29 1838 34
460621 일반 무어의 법칙 이번에는 진짜 끝났다!! 발전 좆됐다!!! [35] lightvector갤로그로 이동합니다. 04.29 3041 35
460600 정보 Qwen1.5-110B : 알리바바의 오픈소스 LLM Qwen1.5 [4] ㅇㅇ(182.230) 04.29 733 21
460599 정보 Meta Llama 3 발표후, 첫 일주일간 생긴 일 [2] ㅇㅇ(182.230) 04.29 1431 26
460583 정보 Figure 60 Minutes 영상 [14] ㅇㅇ(125.191) 04.29 1112 16
460574 정보 중국의 AI 혁신으로 의사보다 두 배 빠른 속도로 식도암 병변 식별 [6] ㅇㅇ갤로그로 이동합니다. 04.29 832 17
460165 정보 터미네이터 감독 "AI가 날 대신할 수도…배우는 대체 못 해" [7] lightvector갤로그로 이동합니다. 04.27 1595 16
460448 정보 사람 음성 받아적는 AI도 '환각' 보여…"없는 말 지어내" [11] ㅇㅇ(182.230) 04.28 933 15
460400 일반 나도 한명 저격해도 되냐 ㅅㅂ [5] ㅇㅇ(14.53) 04.28 3025 30
460365 정보 르쿤이형 : 현재 LLM은 여전히 꽤 멍청. 인간수준 못넘을 것 [25] ㅇㅇ(119.77) 04.28 3181 41
460363 정보 MS Copilot, 사용자 PC 파일 제어 기능 추가 [7] ㅇㅇ(119.77) 04.28 716 24
460334 일반 근데 진짜 념글처럼 ai겨울인거 맞지 않음? [31] ㅇㅇ(112.218) 04.28 2809 18
460332 일반 구글 방금 파이썬팀 해고 [39] ㅇㅇ(125.191) 04.28 3921 21
460316 일반 최근 AI 근황 요약 [33] ㅇㅇ(218.150) 04.28 4896 58
460315 일반 무뚝뚝한 안드로이드 메이드.manhwa [14] ㅇㅇ(125.241) 04.28 2160 39
460264 일반 데이비드 샤피로 "올해 1억개의 일자리를 파괴할 gpt-5 agi 기대" [19] ㅇㅇ(125.191) 04.28 2713 19
460262 일반 양놈들이 보는 'AI 인플루언서' 특 [9] ㅇㅇ(116.124) 04.28 2930 51
460245 일반 학벌이 뭐가 중요할까요 [36] 좋아해킨드갤로그로 이동합니다. 04.28 3020 29
460233 일반 이새끼들 대학타령 하고 있네 [12] ㅇㅇ(58.29) 04.28 1985 20
460201 정보 어도비, '파이어플라이 이미지 3' 출시...'포토샵'에 생성 AI 통합 [3] ㅇㅇ(182.230) 04.28 1229 15
460139 일반 클린 념글 보는 법 [8] SMN갤로그로 이동합니다. 04.27 1807 28
460091 정보 OpenAI 소라 경쟁 Vidu 출시 [23] 선갤러(125.191) 04.27 2575 28
460089 일반 독일 재생에너지 50% 넘음 [21] ㅇㅇ(220.73) 04.27 1187 16
460088 정보 전 FDA 국장 "생명공학의 변곡점이 오고 있다" [23] 선갤러(125.191) 04.27 3386 35
460036 정보 애플, 오픈AI와 협상 재개...'시리'에 '챗GPT' 통합 추진할 듯 [12] ㅇㅇ(182.230) 04.27 598 12
460011 일반 국내연구진은 거른다면서 [48] ㅇㅇ(114.205) 04.27 3129 74
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2