디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] '스트리트 파이터 3' LLM 대전서 'GPT-3.5' 첫 우승

ㅇㅇ(182.230) 2024.04.07 00:48:22
조회 552 추천 6 댓글 7
														
https://www.aitimes.com/news/articleView.html?idxno=158617

 



7ce88870b48507f739ef80e34fee716caaad1b942b72382b3f2a23914642e1f1f9c7d7



대형언어모델(LLM)끼리 겨룬 비디오 게임 '스트리트 파이터 3' 대회에서 'GPT-3.5'가 첫 우승을 차지했다.


톰스하드웨어는 4일(현지시간) 샌프란시스코에서 열린 미스트랄 AI 해커톤에서 GPT-3.5가 오픈AI와 미스트랄 AI의 다른 모델들을 꺾고 우승을 차지했다고 보도했다.

이에 따르면 이번 행사는 미스트랄 AI가 LLM의 게임 플레이 능력을 측정하기 위해 고안한 'SF3 LLM 콜로세움'이라는 벤치마크의 일종이다. LLM 전용 게임 대회는 처음이라는 설명이다.

LLM을 PC의 에뮬레이터에 연결하는 방식으로, 화면에 대한 텍스트 설명을 제공했다. 즉 플레이어의 이전 동작과 상대방의 동작 및 두 캐릭터의 체력 게이지 등을 기반으로 어떤 동작을 할지 계산하도록 지시했다.

게임 중 '켄' 캐릭터만 사용하도록 제한됐다. 이동과 점프, 펀치, 킥은 물론 파동권이나 승룡권같은 특수 기술도 사용했다.

미스트랄 AI는 자체 모델의 여러 버전으로 첫번째 테스트를 진행했으나, 이후 오픈AI의 모델들을 도입해 흥미를 배가했다. 여기에는 미스트랄의 라지, 미디엄, 스몰 등 3가지 모델과 오픈AI의 'GPT-3.5 터보' 'GPT-4' 'GPT-4 터보' 등이 모두 8가지 버전의 LLM이 포함됐다.

풀 리그 방식으로 많은 전투가 펼쳐졌고, 그 결과 GPT-3.5 터보가 승률에 따른 총점 1776.11로 1위를 차지했다. 미스트랄 스몰 파이널버전(1586.16점)이 뒤를 이었다.



일반적인 성능이 더 뛰어난 'GPT-4'의 4가지 버전이 3~6위로 밀렸고,  미스트랄 AI도 큰 모델 2종이 최하위권에 그쳤다. 

미스트랄 AI의 운영진은 이번 시합을 통해 "더 작은 모델은 일반적으로 대기 시간과 속도 이점이 있으며, 이는 이 게임에서 더 많은 시합에서 승리한다는 의미"라고 설명했다. 인간의 격투가 그렇듯 빠른 반응으로 이점을 얻을 수 있다는 설명이다.

한편, 반조 오바요미 아마존 임원이 별도로 14개의 LLM으로 314개의 경기를 치른 결과, 앤트로픽의 '클로드 3 하이쿠'가 1위를 차지했다. 하이쿠 역시 클로드 3 중 가장 작은 모델이다.

또 오바요미는 모델의 환각이나 가드레일 같은 장치가 게임의 플레이를 방해한다는 사실도 알아냈다고 밝혔다.

한편 미스트랄 AI는 프로젝트의 소스 코드를 깃허브에 공개했다. 따라서 누구나 슈퍼컴퓨터 없이도 이를 시도해 볼 수 있다고 전했다.


자동등록방지

추천 비추천

6

고정닉 3

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3208] 특갤용갤로그로 이동합니다. 23.08.06 40975 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [6] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 3031 2
363220 공지 선형글 삭제 기준 [7] 특갤용갤로그로 이동합니다. 23.10.14 7757 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 14077 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [51] 특갤용갤로그로 이동합니다. 23.11.07 9359 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 9020 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 9641 30
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 8633 35
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 23417 34
494572 일반 미래에는 완몰가로 끌고가서 고문할거 같은데 [1] ㅇㅇ(118.235) 11:45 9 0
494571 일반 졸업하고 2년째 백수놀음중인데 ㅇㅇ(39.7) 11:45 15 0
494570 일반 세상을 증오하는 애들 실제로 많잖아 어케야 할까 [1] ㅇㅇ(112.187) 11:42 27 0
494568 일반 학교 시험 망쳤는데 별 느낌이 없다 [9] ㅇㅇ갤로그로 이동합니다. 11:33 58 0
494567 일반 그래서 특이점 언제 옴? [1] ㅇㅇ(221.155) 11:32 30 0
494566 일반 근데 이새끼들 화난이유를 모르겠음 [3] ㅇㅇ(118.235) 11:25 111 3
494565 일반 나는 루머 믿는다. ㅇㅇ갤로그로 이동합니다. 11:25 36 0
494564 일반 빠르게 AGI 안오니깐 일단 노동해라 라익갤로그로 이동합니다. 11:22 23 0
494563 일반 씨발 어제부터 4o 사진첨부 대화가 안되네 나만이럼? ㅇㅇ갤로그로 이동합니다. 11:22 39 0
494562 일반 이제 회의론자들 하나둘 쳐기어나오네 ㅇㅇ(118.235) 11:19 53 0
494561 일반 근데 밥굶는 수준만 아니면 평등이 더 낫지 않아? [12] ㅇㅇ(203.234) 11:19 109 0
494560 일반 agi vs 알트만 자유이용권(섹스가능) [3] ㅇㅇ갤로그로 이동합니다. 11:14 81 0
494559 일반 념글 저거 멀쩡히 번역한거같은데 [1] ㅇㅇ(106.101) 11:14 39 0
494558 일반 아 알트만 매일 한 시간씩만 졸라 패고 싶다 ㅇㅇ(118.235) 11:10 40 0
494557 일반 일리야가 크긴 했나보다 ㅇㅇ(106.101) 11:09 68 1
494556 일반 전에 캐나다사는 운동하는사람 Dona(68.144) 11:00 40 0
494555 일반 agi보다 전쟁이 더 빠를거 같다 ㅇㅇ(223.38) 11:00 45 0
494554 일반 오ai에 대한 조롱이 극에 달했다.. [3] 나도돈벌고싶어갤로그로 이동합니다. 10:53 124 0
494553 일반 클로드3 낙동강 오리알되네 [3] ㅇㅇ(218.234) 10:51 121 0
494552 일반 기업용 gpt데이터 OAI가 본다는거 왜 번역을 하다 말았노? [24] ㅇㅇ갤로그로 이동합니다. 10:42 304 9
494551 일반 특붕이들이 엘리트주의를 이해하는 날이 왔구나 ㅇㅇ(14.56) 10:41 72 0
494550 일반 챗지피티 12개월 단위 구독 존재함? [3] ㅇㅇ(222.104) 10:39 57 0
494549 일반 근데 나도 흙수저긴 한데 왜 기득권이 유지되야 하는지 알겠음 [1] ㅇㅇ갤로그로 이동합니다. 10:39 102 0
494548 일반 무료,유료 유저 기능적 차이 안두면 이꼴 난다고 [2] 분탕치러온거아님갤로그로 이동합니다. 10:34 110 1
494547 일반 근데 진짜 너무 화나는게 느려지더라도 멍청하면 안되는거 아님? [4] ㅇㅇ갤로그로 이동합니다. 10:26 134 4
494546 일반 씨발 ㅇㅇ(220.84) 10:23 44 0
494545 일반 gpt4 api로 쓰면, 성능 일관적으로 유지되냐? [4] ㅇㅇ(218.144) 10:19 93 0
494544 일반 맘편하게 7월로 생각하자 [1] ㅇㅇ갤로그로 이동합니다. 10:17 65 0
494543 일반 4o한테 사이트 디자인이나 게임 만들라고 시키면 [1] ㅇㅇ(118.235) 10:01 97 1
494542 일반 [충격]최고 개발자 절반 뺏긴 OAI* [4] ㅇㅇ(218.147) 09:55 426 2
494541 일반 조선이 다들 절박한가 보다 ㅋㅋ... [8] ㅇㅇ(175.121) 09:47 324 5
494540 일반 안드로이드 앱 gpt4o 안된다 [4] ㅇㅇ(118.235) 09:46 136 0
494539 일반 4o 갈수록 대가리 빡통돼가네 [4] ㅇㅇ(203.254) 09:46 120 0
494538 일반 젠슨황 엔비디아 주식 돌연 매각 [5] ㅇㅇ(118.235) 09:40 338 1
494537 일반 지금 신입 안 뽑는거 걍 경기침체때문인데 [8] ㅇㅇ(106.101) 09:38 159 0
494536 일반 OpenAI 개새끼들아 이딴 뉴스 말고 [1] ㅇㅇ(119.202) 09:30 208 0
494534 일반 아까 본인 소름돋은거..txt [5] ㅇㅇ(39.112) 09:01 316 2
494532 일반 담배못피겠다 [7] ㅇㅇ갤로그로 이동합니다. 08:34 161 0
494531 일반 제미나이는 일상적인 대화에서 재미없긴 함. [4] ㅇㅇ(211.235) 08:25 170 0
494530 일반 노동대체 때문에 보이스 못 내고 있는 거 아님? [7] ㅇㅇ(121.135) 08:24 211 0
494529 일반 보이스 안내놓는 이유는 ㅇㅇ(112.161) 08:20 99 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2