메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보] 메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

ㅇㅇ(182.230) 2024.04.13 10:54:46

조회 795 추천 13 댓글 2

https://www.aitimes.com/news/articleView.html?idxno=158761

메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다. 벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질

www.aitimes.com

7ce88871b38307f739ef8ee14fee766f021d9faf05dc265d0e832e437d07872239d4

메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.

이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다.

벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.

오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질문 범주에 걸쳐, 집과 사무실과 같은 180개 이상의 다양한 실제 환경에 대한 1600개 이상의 질문이 포함돼 있다.

이는 AI 모델이 세상을 인지하고 상호작용하거나 인간과 자연스럽게 소통하며 일상생활에 도움을 줄 수 있는 'AI 에이전트' 개발을 돕는 것이 목표다.

예를 들어 증강현실(AR) 안경에 탑재한 AI 비서나 가정용 로봇에 이를 적용하면, 비디오 카메라나 센서에 사진을 제공하고 ‘열쇠를 어디에서 보았나요’라고 물으면 답할 수 있다.

메타 연구진은 오픈EQA 데이터셋을 구축하기 위해 실제 환경의 비디오 데이터와 3D 스캔을 수집했다. 그다음 비디오를 사람에게 보여주고 AI 에이전트에게 물어보고 싶은 질문을 작성하도록 요청했다.

그 결과로 인식 및 추론 능력을 테스트할 수 있는 1636개의 질문 세트을 구축했다.

예를 들어 ‘식탁 주위에 의자가 몇 개 있나요’라는 질문에 답하려면 AI는 장면의 객체를 인식하고, 주변이라는 공간 개념을 이해하여, 관련 객체의 수를 계산해야 한다. 경우에 따라서는 AI가 개체의 용도와 속성에 대한 기본 지식을 갖고 있어야 한다.

7ce88871b38307f739ef8ee046ee766e9404bc285f48c6d3aa34b46169d5a94ddc

AI 에이전트의 성능을 측정하기 위해 연구진은 대형언어모델(LLM)을 사용, AI 생성 답변이 인간 답변과 얼마나 유사한지 점수를 매겼다.

그 결과 'GPT-4V'와 같은 첨단 비전언어모델(VLM) 모델조차도 새로운 벤치마크인 오픈EQA에서 인간 수준의 답변을 하는 데 어려움을 겪는 것으로 나타났다. 실제로 공간 이해가 필요한 질문의 경우, 기존 VLM은 거의 ‘맹인’ 수준이라는 지적이다.

연구진은 이 벤치마크 세트를 통해 AI가 물리적인 세상을 더 잘 이해하는 방향으로 발전하기를 바란다고 밝혔다.

또 메타는 이에 앞서 지난 2월 'V-제파(Video Joint Embedding Predictive Architecture)'라는 모델을 통해 현실 세계에서 일어나는 개체 간 상호작용을 이해하고 예측할 수 있는 방법을 제시한 바 있다.

인간이 주변 세계를 배우는 방법처럼 AI도 물리적인 세계를 시각으로 경험, 수많은 텍스트 데이터를 학습하는 것보다 실질적이고 유용한 지식을 얻게 한다는 의도다. 이는 "기계 지능을 발전시키는 중요한 단계"라고 강조했다.

즉 메타는 최근 인공일반지능(AGI)으로 발전할 중요한 단서로 기존 '트랜스포머' 아키텍처와는 다른 제파 모델을 강조하고 있다. 이를 통해 AI가 사람처럼 추론하고 계획을 세울 수 있다는 설명이다.

이날 공개한 데이터셋도 이런 맥락에서 공개한 것으로 볼 수 있다.

고정닉 3

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2860	설문	경제관념 부족해서 돈 막 쓸 것 같은 스타는?	운영자	24/05/13	-	-
459689	정보	샘알트만 스탠포드 강연 내용 번역본 [20]	ㅇㅇ(119.77)	04.26	2659	20
459726	일반	미국 쓰로우플레임, 화염방사기 로봇개 출시 [20]	ㅇㅇ(218.150)	04.26	1259	23
459720	일반	Gpt 4 능가한 중국의 LLM [10]	ㅇㅇ(116.120)	04.26	1888	17
459693	정보	현재 AI 한계, 단점 보완 연구 및 스타트업 무쓸모행 [16]	ㅇㅇ(119.77)	04.26	2665	31
459664	정보	2시간만에 다이아몬드 생산 해냄.news [10]	007빵(175.194)	04.25	848	20
459649	일반	알트만 또 하나의 업보 적립... [9]	ㅇㅇ(119.77)	04.25	1671	15
459625	일반	gpt5에 대한 기대감이 크게 떨어진 사건 [1]	ㅇㅇ(221.168)	04.25	1478	17
459603	정보	"애플, 수요 부족으로 비전 프로 생산 조기 중단" [28]	ㅇㅇ(182.230)	04.25	2499	23
459575	정보	미드저니 ceo "향후 12개월은 실시간 3d 비디오" [9]	특술람	04.25	2224	28
459556	일반	OpenAI 4월 29일 GPT4 업그레이드 가능성 [19]	모브	04.25	2758	19
459547	일반	특갤사이클 존나 웃기다니까 [6]	ㅇㅇ(106.102)	04.25	2008	49
459519	일반	스탠포드 병신이 비밀이라 했던거 [18]	ㅇㅇ(119.77)	04.25	2510	21
459493	일반	알트만 씨발놈 소식은 gpt5 공개될때까지 임시 언급금지 때리면 안됨? [10]	ㅇㅇ(118.33)	04.25	2416	54
459489	정보	AI 모델에서 "그것"은 데이터셋이다. [7]	ㅇㅇ(61.73)	04.25	1750	24
459484	일반	이거 ㅈㄴ웃기네 [19]	헬스토끼	04.25	2506	23
459478	일반	클로드 오늘 어마어마한 업뎃함 [10]	ㅇㅇ(115.138)	04.25	886	10
459429	정보	플라톤 무덤 위치 미스터리, AI로 밝혀냈다 [29]	ㅇㅇ	04.25	2844	34
459224	정보	상상할 수 있는 최악의 질문을 생성한 대가로 보상을 받는 '독성 AI' [17]	ㅇㅇ	04.24	1555	20
459428	정보	모더나와 OpenAI가 협력하여 생명을 구하는 치료법 개발중 [10]	ㅇㅇ(211.59)	04.25	1674	24
459454	정보	데이터셋이 전부라는 OAI 증언 [12]	ㅇㅇ(119.77)	04.25	2216	26
459345	정보	일론 머스크 "옵티머스 로봇, 내년에 판매 시작" [28]	니지카엘	04.24	2580	28
459453	일반	open ai에 첫 h200 도착 [27]	ㅇㅇ(175.124)	04.25	1957	30
459391	정보	다리오 아모데이 "무한 데이터 생성 가능" [9]	ㅇㅇ(125.191)	04.24	913	13
459370	일반	지금 OpenAI가 출시 전 준비하는 건 맞는 듯 [14]	모브	04.24	2298	24
459245	일반	챗봇아레나 라마3 소식: 계속 순위가 오름; [22]	ㅇㅇ(110.145)	04.24	2458	24
459203	정보	기억에 남을 순간, 시간이 '느리게' 느껴진다 [14]	ㅇㅇ(182.230)	04.24	3082	29
459195	정보	OpenAI 블로그 새 글: 아동 안전 [4]	모브	04.24	931	19
459187	정보	아마존, 75만 대 이상의 로봇을 배치해 10만 명의 인력 대체 [10]	니지카엘	04.23	2864	27
459176	일반	GPT 토큰 5억 개 학습 후 얻은 교훈들 [21]	ㅇㅇ(221.157)	04.23	3566	31
459059	정보	엔비디아, 10시간 만에 '알파폴드' 훈련 완료하는 '스케일폴드' 공개 [14]	ㅇㅇ(182.230)	04.23	3177	33
459058	정보	세계 최초 AI 생성 유전자 편집기 ‘오픈크리스퍼-1’ 등장 [11]	ㅇㅇ(182.230)	04.23	2579	27
459057	정보	중국 손절한 UAE, 미국과 잇달아 협업...MS 이어 퀄컴과 파트너십 [4]	ㅇㅇ(182.230)	04.23	970	24
459053	일반	하사비스, 소라는 넘사벽이다 인정 [3]	ㅇㅇ(218.147)	04.23	1485	26
459050	정보	MS, 삼성·LG·SK·하이닉스 대표 등과 5월 회동...파트너십 구축 [4]	ㅇㅇ(182.230)	04.23	1435	28
459049	일반	갤에 올라왔던 유아의 언어 습득과 LLM 관련... [12]	ㅇㅇ(1.245)	04.23	1035	25
459028	정보	'한줌 흙으로'...친환경 '인간 퇴비장' 미국서 확산 [13]	ㅇㅇ(182.230)	04.23	1256	18
458964	정보	Microsoft, Phi-3 발표 [18]	ㅇㅇ(175.124)	04.23	2957	31
458899	정보	Meta, 퀘스트os 오픈소스 [15]	ㅇㅇ(123.100)	04.23	1669	25
458401	정보	개인별 커스터마이징 가능한 "암백신" 개발중 [16]	noosphere	04.21	2734	27
458785	일반	왜 '특이점이 온다'를 서점에서 팔죠..? [13]	떼껄룩해적단	04.22	3814	37
458759	일반	“K팝 이끌려 선택한 한국行, 하고 싶던 연구 맘껏” 뇌의 심장 제어 메 [8]	천재까마귀	04.22	1772	22
458758	정보	저커버그 "AI 학습 데이터보다 중요한 것은 피드백 루프" [4]	ㅇㅇ(182.230)	04.22	1255	18
458703	일반	골빈해커 피셜 LLM의 미친 발전속도.jpg [10]	lightvector	04.22	659	10
458659	정보	무스타파 술레이만, 인류를 위한 AI 발전 억제 주장 [9]	모브	04.22	624	19
458630	일반	선갤, 앰생몰이 거르고 인생 ㅈㄴ 고달픈 이유 [50]	ㅇㅇ(125.133)	04.22	3122	32
458628	정보	ollama 포스트 : 라마3은 그렇게 검열 심하지 않은 편 [9]	ㅇㅇ	04.22	1402	17
458627	일반	FFF 저 시발련은 전략 바꿈 [9]	ㅇㅇ(123.100)	04.22	437	11
458583	일반	(루머) GPT5는 5~10배 강하며, 기존 벤치마크 무의미 [29]	ㅇㅇ(123.100)	04.22	4026	31
458384	정보	힌튼 "뇌를 여전히 이해하지 못할 가능성" [24]	ㅇㅇ(121.132)	04.21	3724	25
458424	정보	요슈아 벤지오 인터뷰 요약 [3]	ㅇㅇ(220.83)	04.21	1519	22