디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

ㅇㅇ(182.230) 2024.04.13 10:54:46
조회 786 추천 13 댓글 2
														

https://www.aitimes.com/news/articleView.html?idxno=158761

 



7ce88871b38307f739ef8ee14fee766f021d9faf05dc265d0e832e437d07872239d4



메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.


이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다.


벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.


오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질문 범주에 걸쳐, 집과 사무실과 같은 180개 이상의 다양한 실제 환경에 대한 1600개 이상의 질문이 포함돼 있다.


이는 AI 모델이 세상을 인지하고 상호작용하거나 인간과 자연스럽게 소통하며 일상생활에 도움을 줄 수 있는 'AI 에이전트' 개발을 돕는 것이 목표다.


예를 들어 증강현실(AR) 안경에 탑재한 AI 비서나 가정용 로봇에 이를 적용하면, 비디오 카메라나 센서에 사진을 제공하고 ‘열쇠를 어디에서 보았나요’라고 물으면 답할 수 있다.


메타 연구진은 오픈EQA 데이터셋을 구축하기 위해 실제 환경의 비디오 데이터와 3D 스캔을 수집했다. 그다음 비디오를 사람에게 보여주고 AI 에이전트에게 물어보고 싶은 질문을 작성하도록 요청했다.


그 결과로 인식 및 추론 능력을 테스트할 수 있는 1636개의 질문 세트을 구축했다.


예를 들어 ‘식탁 주위에 의자가 몇 개 있나요’라는 질문에 답하려면 AI는 장면의 객체를 인식하고, 주변이라는 공간 개념을 이해하여, 관련 객체의 수를 계산해야 한다. 경우에 따라서는 AI가 개체의 용도와 속성에 대한 기본 지식을 갖고 있어야 한다.



7ce88871b38307f739ef8ee046ee766e9404bc285f48c6d3aa34b46169d5a94ddc



AI 에이전트의 성능을 측정하기 위해 연구진은 대형언어모델(LLM)을 사용, AI 생성 답변이 인간 답변과 얼마나 유사한지 점수를 매겼다.


그 결과 'GPT-4V'와 같은 첨단 비전언어모델(VLM) 모델조차도 새로운 벤치마크인 오픈EQA에서 인간 수준의 답변을 하는 데 어려움을 겪는 것으로 나타났다. 실제로 공간 이해가 필요한 질문의 경우, 기존 VLM은 거의 ‘맹인’ 수준이라는 지적이다.


연구진은 이 벤치마크 세트를 통해 AI가 물리적인 세상을 더 잘 이해하는 방향으로 발전하기를 바란다고 밝혔다.


또 메타는 이에 앞서 지난 2월 'V-제파(Video Joint Embedding Predictive Architecture)'라는 모델을 통해 현실 세계에서 일어나는 개체 간 상호작용을 이해하고 예측할 수 있는 방법을 제시한 바 있다.


인간이 주변 세계를 배우는 방법처럼 AI도 물리적인 세계를 시각으로 경험, 수많은 텍스트 데이터를 학습하는 것보다 실질적이고 유용한 지식을 얻게 한다는 의도다. 이는 "기계 지능을 발전시키는 중요한 단계"라고 강조했다.


즉 메타는 최근 인공일반지능(AGI)으로 발전할 중요한 단서로 기존 '트랜스포머' 아키텍처와는 다른 제파 모델을 강조하고 있다. 이를 통해 AI가 사람처럼 추론하고 계획을 세울 수 있다는 설명이다.


이날 공개한 데이터셋도 이런 맥락에서 공개한 것으로 볼 수 있다.


자동등록방지

추천 비추천

13

고정닉 3

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2856 설문 주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는? 운영자 24/04/29 - -
460348 일반 행복은 멀리있지않다 [14] ㅇㅇ(58.125) 04.28 378 4
460347 일반 특이점 언제옴 ㅇㅇ(220.122) 04.28 44 0
460345 일반 완장들 일요일이라고 놀러나갔노 [9] ㅇㅇ(61.97) 04.28 183 0
460344 일반 갤 눈팅 하다보니까 올해 3월에 무슨 보고서 같은 거 올라옴? [1] ㅇㅇ(220.71) 04.28 102 0
460338 일반 근데 gpt5가 엄청 좋게나와도 결국 되풀이 될 것 같아 [1] ㅇㅇ(1.240) 04.28 135 0
460336 일반 알트만은 오픈ai내부상황 다 아는거아님? [11] ㅇㅇ갤로그로 이동합니다. 04.28 306 1
460334 일반 근데 진짜 념글처럼 ai겨울인거 맞지 않음? [31] ㅇㅇ(112.218) 04.28 2550 18
460333 일반 2025 => 2027 => 2029 [2] ㅇㅇ(59.11) 04.28 223 0
460332 일반 구글 방금 파이썬팀 해고 [39] ㅇㅇ(125.191) 04.28 3531 21
460331 일반 코파일럿 이거 뭐냐 [1] ㅇㅇ(58.140) 04.28 150 4
460330 일반 아래 소라-언리얼엔진 글 보고 든생각인데 [7] ㅇㅇ갤로그로 이동합니다. 04.28 263 2
460329 정보 2032년 '한국 독자 개발 달 착륙선' 발사…2단계 사업 예타 통과 [5] ㅇㅇ(182.230) 04.28 137 4
460328 정보 인도, 달 탐사선 '찬드라얀 3호' 발사 성공...내달 23일 달 착륙 [2] ㅇㅇ(182.230) 04.28 73 4
460327 정보 중국 달 탐사선 창어 5호 달 토양 싣고 귀환길 올랐다 [2] ㅇㅇ(182.230) 04.28 62 2
460325 일반 인공지능 위협 막을 '어벤저스' 떴다 머스크·저커버그는 제외 [3] ㅇㅇ갤로그로 이동합니다. 04.28 208 5
460324 일반 마음에 금이 가기 시작한다... [3] ㅇㅇ(121.142) 04.28 267 8
460323 일반 '60도 찍었다' 바닷물도 데우더니 급기야…"비극 시작" ㅇㅇ(125.191) 04.28 170 1
460322 AI창 ai짤 몇개.ai [8] ㅇㅇ(175.115) 04.28 407 8
460320 일반 지금 당장 AGI 등장 VS 기술 발전 영구적으로 2배 빨라짐 [2] ㅇㅇ(110.76) 04.28 200 0
460319 일반 이 세상이 시뮬레이션이라고 생각하고 잠들면 [3] ㅇㅇ(113.59) 04.28 169 2
460317 일반 데이비드 싱클레어 사기꾼같지는 않아 [3] ㅇㅇ(183.96) 04.28 228 0
460316 일반 최근 AI 근황 요약 [33] ㅇㅇ(218.150) 04.28 4346 58
460315 일반 무뚝뚝한 안드로이드 메이드.manhwa [15] ㅇㅇ(125.241) 04.28 1987 38
460314 일반 2027까지 agi 안나오면 특붕이들이 진걸로 하자 [7] ㅇㅇ(221.154) 04.28 230 4
460313 정보 中, 역대 가장 상세한 달 표면 지질지도 공개 [4] ㅇㅇ(182.230) 04.28 335 6
460312 일반 난 사실 유사 특이점 누리고 있어서 특이점 적극 찬성함. [3] ㅇㅇ(1.251) 04.28 278 1
460310 일반 ai로 쌍둥이 만들기 [6] ㅇㅇ(1.251) 04.28 169 3
460309 일반 난 지금 한국에 태어난거에 너무 만족하는데 [9] ㅇㅇ(220.119) 04.28 298 3
460308 일반 코끼리 << 어쩌면 인간보다 똑똑할지도? [24] 비오는날의개구리갤로그로 이동합니다. 04.28 361 4
460307 AI창 Sony 사진대회 기사 뜨콜갤로그로 이동합니다. 04.28 74 1
460306 AI창 그런 의미에서 실사로 여자 뜨콜갤로그로 이동합니다. 04.28 188 1
460304 일반 Gpt5가 agi라고? 이게 대체 무슨 말도안되는소리임 [2] ㅇㅇ(121.131) 04.28 423 5
460303 일반 특갤러 입갤 [19] 비오는날의개구리갤로그로 이동합니다. 04.28 282 4
460299 일반 특이점 관점에서 보면 결국 노동자들은 다 비슷비슷함 [1] ㅇㅇ(121.135) 04.28 156 2
460298 일반 2025agi = 일론머스크가 주장 [7] ㅇㅇ(59.11) 04.28 310 0
460297 일반 특갤이 개병신만 남은 이유 [6] ㅇㅇ(220.84) 04.28 336 4
460296 일반 원래 사회의 가치창출은 극소수의 자본가들이 견인하는 거 아님? [2] ㅇㅇ(221.155) 04.28 159 3
460295 일반 시벌 gpt5 = agi 거의 확정인 분위기네 [17] ㅇㅇ(183.105) 04.28 574 1
460294 일반 특붕이에게 행복은 맹인에게 세상과같으니 ㅇㅇ(1.222) 04.28 55 0
460293 AI창 [글 음악] [음악] 다음은 김미래 양의 댄스를 보겠습니다. ㅇㅇ(61.101) 04.28 69 1
460292 일반 초지능 1년안에 도달가능하다고 말한 닉보스트롬 과 데이비드사피로 [9] 친근한게이브갤로그로 이동합니다. 04.28 387 3
460291 일반 책임이따르는 상류층은 상위 0.01% 이런애들이지 [2] ㅇㅇ(59.11) 04.28 231 0
460290 일반 근데 소라나 언리얼엔진이나 차이가 뭐임 [47] ㅇㅇ(210.182) 04.28 378 0
460289 일반 gpt4.5 100m(1억개)의 일자리를 자동화시킬것으로 예상 [4] 친근한게이브갤로그로 이동합니다. 04.28 225 2
460288 일반 난 백수여도 엄마한테 애교부려서 사랑받음 [4] ㅇㅇ(218.158) 04.28 193 0
460287 일반 상위 1%가 행복하다는 망상충들 [4] ㅇㅇ(1.236) 04.28 199 2
460286 일반 사우디 네옴 시티는 완전 중단으로 가는 분위기네 [3] ㅇㅇ(211.59) 04.28 210 1
460285 일반 소라의 최종형태 [2] ㅇㅇ(59.11) 04.28 155 0
460284 일반 빨리 개나소나 영상ai 만들었으면 좋겠음 ㅇㅇ(183.105) 04.28 59 0
460283 토의 특이점주의를 접한 사람이 이렇게 반응하면 어떻게 됨? [6] 사수리나무갤로그로 이동합니다. 04.28 219 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2