메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 부재중입니다.(hnn12) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보] 메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

ㅇㅇ(182.230) 2024.04.13 10:54:46

조회 786 추천 13 댓글 2

https://www.aitimes.com/news/articleView.html?idxno=158761

메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다. 벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질

www.aitimes.com

7ce88871b38307f739ef8ee14fee766f021d9faf05dc265d0e832e437d07872239d4

메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.

이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다.

벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.

오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질문 범주에 걸쳐, 집과 사무실과 같은 180개 이상의 다양한 실제 환경에 대한 1600개 이상의 질문이 포함돼 있다.

이는 AI 모델이 세상을 인지하고 상호작용하거나 인간과 자연스럽게 소통하며 일상생활에 도움을 줄 수 있는 'AI 에이전트' 개발을 돕는 것이 목표다.

예를 들어 증강현실(AR) 안경에 탑재한 AI 비서나 가정용 로봇에 이를 적용하면, 비디오 카메라나 센서에 사진을 제공하고 ‘열쇠를 어디에서 보았나요’라고 물으면 답할 수 있다.

메타 연구진은 오픈EQA 데이터셋을 구축하기 위해 실제 환경의 비디오 데이터와 3D 스캔을 수집했다. 그다음 비디오를 사람에게 보여주고 AI 에이전트에게 물어보고 싶은 질문을 작성하도록 요청했다.

그 결과로 인식 및 추론 능력을 테스트할 수 있는 1636개의 질문 세트을 구축했다.

예를 들어 ‘식탁 주위에 의자가 몇 개 있나요’라는 질문에 답하려면 AI는 장면의 객체를 인식하고, 주변이라는 공간 개념을 이해하여, 관련 객체의 수를 계산해야 한다. 경우에 따라서는 AI가 개체의 용도와 속성에 대한 기본 지식을 갖고 있어야 한다.

7ce88871b38307f739ef8ee046ee766e9404bc285f48c6d3aa34b46169d5a94ddc

AI 에이전트의 성능을 측정하기 위해 연구진은 대형언어모델(LLM)을 사용, AI 생성 답변이 인간 답변과 얼마나 유사한지 점수를 매겼다.

그 결과 'GPT-4V'와 같은 첨단 비전언어모델(VLM) 모델조차도 새로운 벤치마크인 오픈EQA에서 인간 수준의 답변을 하는 데 어려움을 겪는 것으로 나타났다. 실제로 공간 이해가 필요한 질문의 경우, 기존 VLM은 거의 ‘맹인’ 수준이라는 지적이다.

연구진은 이 벤치마크 세트를 통해 AI가 물리적인 세상을 더 잘 이해하는 방향으로 발전하기를 바란다고 밝혔다.

또 메타는 이에 앞서 지난 2월 'V-제파(Video Joint Embedding Predictive Architecture)'라는 모델을 통해 현실 세계에서 일어나는 개체 간 상호작용을 이해하고 예측할 수 있는 방법을 제시한 바 있다.

인간이 주변 세계를 배우는 방법처럼 AI도 물리적인 세계를 시각으로 경험, 수많은 텍스트 데이터를 학습하는 것보다 실질적이고 유용한 지식을 얻게 한다는 의도다. 이는 "기계 지능을 발전시키는 중요한 단계"라고 강조했다.

즉 메타는 최근 인공일반지능(AGI)으로 발전할 중요한 단서로 기존 '트랜스포머' 아키텍처와는 다른 제파 모델을 강조하고 있다. 이를 통해 AI가 사람처럼 추론하고 계획을 세울 수 있다는 설명이다.

이날 공개한 데이터셋도 이런 맥락에서 공개한 것으로 볼 수 있다.

고정닉 3

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2856	설문	주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는?	운영자	24/04/29	-	-
460348	일반	행복은 멀리있지않다 [14]	ㅇㅇ(58.125)	04.28	378	4
460347	일반	특이점 언제옴	ㅇㅇ(220.122)	04.28	44	0
460345	일반	완장들 일요일이라고 놀러나갔노 [9]	ㅇㅇ(61.97)	04.28	183	0
460344	일반	갤 눈팅 하다보니까 올해 3월에 무슨 보고서 같은 거 올라옴? [1]	ㅇㅇ(220.71)	04.28	102	0
460338	일반	근데 gpt5가 엄청 좋게나와도 결국 되풀이 될 것 같아 [1]	ㅇㅇ(1.240)	04.28	135	0
460336	일반	알트만은 오픈ai내부상황 다 아는거아님? [11]	ㅇㅇ	04.28	306	1
460334	일반	근데 진짜 념글처럼 ai겨울인거 맞지 않음? [31]	ㅇㅇ(112.218)	04.28	2550	18
460333	일반	2025 => 2027 => 2029 [2]	ㅇㅇ(59.11)	04.28	223	0
460332	일반	구글 방금 파이썬팀 해고 [39]	ㅇㅇ(125.191)	04.28	3531	21
460331	일반	코파일럿 이거 뭐냐 [1]	ㅇㅇ(58.140)	04.28	150	4
460330	일반	아래 소라-언리얼엔진 글 보고 든생각인데 [7]	ㅇㅇ	04.28	263	2
460329	정보	2032년 '한국 독자 개발 달 착륙선' 발사…2단계 사업 예타 통과 [5]	ㅇㅇ(182.230)	04.28	137	4
460328	정보	인도, 달 탐사선 '찬드라얀 3호' 발사 성공...내달 23일 달 착륙 [2]	ㅇㅇ(182.230)	04.28	73	4
460327	정보	중국 달 탐사선 창어 5호 달 토양 싣고 귀환길 올랐다 [2]	ㅇㅇ(182.230)	04.28	62	2
460325	일반	인공지능 위협 막을 '어벤저스' 떴다 머스크·저커버그는 제외 [3]	ㅇㅇ	04.28	208	5
460324	일반	마음에 금이 가기 시작한다... [3]	ㅇㅇ(121.142)	04.28	267	8
460323	일반	'60도 찍었다' 바닷물도 데우더니 급기야…"비극 시작"	ㅇㅇ(125.191)	04.28	170	1
460322	AI창 AI창작	ai짤 몇개.ai [8]	ㅇㅇ(175.115)	04.28	407	8
460320	일반	지금 당장 AGI 등장 VS 기술 발전 영구적으로 2배 빨라짐 [2]	ㅇㅇ(110.76)	04.28	200	0
460319	일반	이 세상이 시뮬레이션이라고 생각하고 잠들면 [3]	ㅇㅇ(113.59)	04.28	169	2
460317	일반	데이비드 싱클레어 사기꾼같지는 않아 [3]	ㅇㅇ(183.96)	04.28	228	0
460316	일반	최근 AI 근황 요약 [33]	ㅇㅇ(218.150)	04.28	4346	58
460315	일반	무뚝뚝한 안드로이드 메이드.manhwa [15]	ㅇㅇ(125.241)	04.28	1987	38
460314	일반	2027까지 agi 안나오면 특붕이들이 진걸로 하자 [7]	ㅇㅇ(221.154)	04.28	230	4
460313	정보	中, 역대 가장 상세한 달 표면 지질지도 공개 [4]	ㅇㅇ(182.230)	04.28	335	6
460312	일반	난 사실 유사 특이점 누리고 있어서 특이점 적극 찬성함. [3]	ㅇㅇ(1.251)	04.28	278	1
460310	일반	ai로 쌍둥이 만들기 [6]	ㅇㅇ(1.251)	04.28	169	3
460309	일반	난 지금 한국에 태어난거에 너무 만족하는데 [9]	ㅇㅇ(220.119)	04.28	298	3
460308	일반	코끼리 << 어쩌면 인간보다 똑똑할지도? [24]	비오는날의개구리	04.28	361	4
460307	AI창 AI창작	Sony 사진대회 기사	뜨콜	04.28	74	1
460306	AI창 AI창작	그런 의미에서 실사로 여자	뜨콜	04.28	188	1
460304	일반	Gpt5가 agi라고? 이게 대체 무슨 말도안되는소리임 [2]	ㅇㅇ(121.131)	04.28	423	5
460303	일반	특갤러 입갤 [19]	비오는날의개구리	04.28	282	4
460299	일반	특이점 관점에서 보면 결국 노동자들은 다 비슷비슷함 [1]	ㅇㅇ(121.135)	04.28	156	2
460298	일반	2025agi = 일론머스크가 주장 [7]	ㅇㅇ(59.11)	04.28	310	0
460297	일반	특갤이 개병신만 남은 이유 [6]	ㅇㅇ(220.84)	04.28	336	4
460296	일반	원래 사회의 가치창출은 극소수의 자본가들이 견인하는 거 아님? [2]	ㅇㅇ(221.155)	04.28	159	3
460295	일반	시벌 gpt5 = agi 거의 확정인 분위기네 [17]	ㅇㅇ(183.105)	04.28	574	1
460294	일반	특붕이에게 행복은 맹인에게 세상과같으니	ㅇㅇ(1.222)	04.28	55	0
460293	AI창 AI창작	[글 음악] [음악] 다음은 김미래 양의 댄스를 보겠습니다.	ㅇㅇ(61.101)	04.28	69	1
460292	일반	초지능 1년안에 도달가능하다고 말한 닉보스트롬 과 데이비드사피로 [9]	친근한게이브	04.28	387	3
460291	일반	책임이따르는 상류층은 상위 0.01% 이런애들이지 [2]	ㅇㅇ(59.11)	04.28	231	0
460290	일반	근데 소라나 언리얼엔진이나 차이가 뭐임 [47]	ㅇㅇ(210.182)	04.28	378	0
460289	일반	gpt4.5 100m(1억개)의 일자리를 자동화시킬것으로 예상 [4]	친근한게이브	04.28	225	2
460288	일반	난 백수여도 엄마한테 애교부려서 사랑받음 [4]	ㅇㅇ(218.158)	04.28	193	0
460287	일반	상위 1%가 행복하다는 망상충들 [4]	ㅇㅇ(1.236)	04.28	199	2
460286	일반	사우디 네옴 시티는 완전 중단으로 가는 분위기네 [3]	ㅇㅇ(211.59)	04.28	210	1
460285	일반	소라의 최종형태 [2]	ㅇㅇ(59.11)	04.28	155	0
460284	일반	빨리 개나소나 영상ai 만들었으면 좋겠음	ㅇㅇ(183.105)	04.28	59	0
460283	토의	특이점주의를 접한 사람이 이렇게 반응하면 어떻게 됨? [6]	사수리나무	04.28	219	0