메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] 메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

ㅇㅇ(182.230) 2024.04.13 10:54:46

조회 804 추천 13 댓글 2

https://www.aitimes.com/news/articleView.html?idxno=158761

메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다. 벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질

www.aitimes.com

7ce88871b38307f739ef8ee14fee766f021d9faf05dc265d0e832e437d07872239d4

메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.

이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다.

벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.

오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질문 범주에 걸쳐, 집과 사무실과 같은 180개 이상의 다양한 실제 환경에 대한 1600개 이상의 질문이 포함돼 있다.

이는 AI 모델이 세상을 인지하고 상호작용하거나 인간과 자연스럽게 소통하며 일상생활에 도움을 줄 수 있는 'AI 에이전트' 개발을 돕는 것이 목표다.

예를 들어 증강현실(AR) 안경에 탑재한 AI 비서나 가정용 로봇에 이를 적용하면, 비디오 카메라나 센서에 사진을 제공하고 ‘열쇠를 어디에서 보았나요’라고 물으면 답할 수 있다.

메타 연구진은 오픈EQA 데이터셋을 구축하기 위해 실제 환경의 비디오 데이터와 3D 스캔을 수집했다. 그다음 비디오를 사람에게 보여주고 AI 에이전트에게 물어보고 싶은 질문을 작성하도록 요청했다.

그 결과로 인식 및 추론 능력을 테스트할 수 있는 1636개의 질문 세트을 구축했다.

예를 들어 ‘식탁 주위에 의자가 몇 개 있나요’라는 질문에 답하려면 AI는 장면의 객체를 인식하고, 주변이라는 공간 개념을 이해하여, 관련 객체의 수를 계산해야 한다. 경우에 따라서는 AI가 개체의 용도와 속성에 대한 기본 지식을 갖고 있어야 한다.

7ce88871b38307f739ef8ee046ee766e9404bc285f48c6d3aa34b46169d5a94ddc

AI 에이전트의 성능을 측정하기 위해 연구진은 대형언어모델(LLM)을 사용, AI 생성 답변이 인간 답변과 얼마나 유사한지 점수를 매겼다.

그 결과 'GPT-4V'와 같은 첨단 비전언어모델(VLM) 모델조차도 새로운 벤치마크인 오픈EQA에서 인간 수준의 답변을 하는 데 어려움을 겪는 것으로 나타났다. 실제로 공간 이해가 필요한 질문의 경우, 기존 VLM은 거의 ‘맹인’ 수준이라는 지적이다.

연구진은 이 벤치마크 세트를 통해 AI가 물리적인 세상을 더 잘 이해하는 방향으로 발전하기를 바란다고 밝혔다.

또 메타는 이에 앞서 지난 2월 'V-제파(Video Joint Embedding Predictive Architecture)'라는 모델을 통해 현실 세계에서 일어나는 개체 간 상호작용을 이해하고 예측할 수 있는 방법을 제시한 바 있다.

인간이 주변 세계를 배우는 방법처럼 AI도 물리적인 세계를 시각으로 경험, 수많은 텍스트 데이터를 학습하는 것보다 실질적이고 유용한 지식을 얻게 한다는 의도다. 이는 "기계 지능을 발전시키는 중요한 단계"라고 강조했다.

즉 메타는 최근 인공일반지능(AGI)으로 발전할 중요한 단서로 기존 '트랜스포머' 아키텍처와는 다른 제파 모델을 강조하고 있다. 이를 통해 AI가 사람처럼 추론하고 계획을 세울 수 있다는 설명이다.

이날 공개한 데이터셋도 이런 맥락에서 공개한 것으로 볼 수 있다.

고정닉 3

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2864	설문	비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는?	운영자	24/06/03	-	-
464957	일반	코딩 개초보가 GPT 로 고오급 웹사이트 만들기 [41]	GPT PLUS(125.137)	05.10	4641	44
464910	일반	현재 갤 상황 요약...jpg [21]	lightvector	05.09	5000	38
464863	일반	장문글)내가 특이점을 기다리는 이유...txt [33]	ㅇㅇ(1.238)	05.09	3138	35
464749	일반	also gpt2 쓰레긴데? [9]	ㅇㅇ(114.200)	05.09	1483	14
464601	일반	also-gpt2한테 샘알트만 비판하라고 해봤는데 [16]	ㅇㅇ	05.09	4002	33
464599	일반	im-good과 also모델에게 실존 인물 비방을 시켜봤다. [9]	월코존버	05.09	2512	22
464597	정보/ 정보/뉴스	구글, ‘알파폴드3’ 네이처에 공개…정확도 1.5배, DNA까지 분석 [27]	ㅇㅇ(125.191)	05.09	3329	30
464587	정보/ 정보/뉴스	알파폴드 3 발표 [21]	ㅇㅇ(125.191)	05.09	3392	27
464357	일반	gpt2는 검색용모델일 확률이 높음 [5]	ㅇㅇ(14.53)	05.08	3208	20
464341	정보/ 정보/뉴스	AI가 신약 개발에 있어 획기적 성과를 거두는중 [18]	ㅇㅇ(211.59)	05.08	3558	25
464249	일반	LLM방식은 한계가 있다고 말했던 얀르쿤이 옳았던것 같으면 개추 [13]	ㅇㅇ(169.150)	05.08	3282	38
464125	일반	also-gpt2나 gpt2나 코딩 실력은 gpt4를 아득히 상회함 [8]	Ad_Astra	05.08	4328	21
464124	일반	also good GPT2가 클로드 완전히 찢어갈기네 걍 [2]	ㅇㅇ(121.124)	05.08	4211	20
464104	일반	와 also gpt2가 클로드 압살하네 ㅋㅋㅋ [1]	아몰라(223.62)	05.08	2849	16
464050	일반	트윗 ㅋㅋㅋ GPT2 요청 한번에 게임만들기 가능 [16]	ㅇㅇ(14.63)	05.08	4267	30
464038	AI창 AI창작	진짜 볼 수록 지리네 [25]	ㅇㅇ(119.77)	05.07	5301	42
463983	일반	agi위해선 추론이 필수적인데 조금 짜치긴 하네... [18]	lightvector	05.07	2956	25
463897	정보/ 정보/뉴스	also gpt로 어려운 컴퓨터 비전 대회 성공했다 [38]	ㅇㅇ(119.77)	05.07	3343	34
463804	일반	방금 점프에 장애물추가 콜리전추가 원큐에성공 ㅅㅂㅋㅋㅋㅋ [22]	친근한게이브	05.07	2531	28
463784	일반	also gpt2 미침 걍 agi 2단계임 영상있음 [7]	친근한게이브	05.07	3787	27
463783	일반	지리긴 하네..ㄷㄷ 소설도 뚝딱임 [13]	라익	05.07	3556	17
463742	일반	also gpt2 일단 확실한 거는 [7]	ㅇㅇ(125.137)	05.07	3945	16
463666	AI창 AI창작	재미로 클로드 gpt2 시 만들어보기 [3]	포스트휴먼.	05.07	1641	15
463659	일반	also vs gpt-4 한국어 시 테스트 [29]	ㅇㅇ(182.213)	05.07	2802	32
463654	일반	GPT4 원래 이렇게 삐리했나? [13]	월코존버	05.07	2457	21
463649	일반	Also 미쳤는데 ㅋㅋㅋㅋ [1]	헬스토끼	05.07	3119	15
463627	일반	also gpt2 깔끔하네 [1]	ㅇㅇ	05.07	2173	14
463603	일반	약간 충격받은 also gpt-2 후기 [12]	컴퓨터비전	05.07	4420	17
463597	일반	also gpt 진짜 미쳤는데? [2]	ㅇㅇ	05.07	2581	12
463587	정보/ 정보/뉴스	아레나) gpt2, gpt-4, 클로드3 사칙연산 테스트 결과 [10]	ㅇㅇ	05.07	2214	17
463584	일반	ㅋㅋGPT2 작문 실력 확실히 늘어나긴했네 [3]	월코존버	05.07	2039	22
463157	정보/ 정보/뉴스	올해 말까지 테슬라 옵티머스 DoF 업그레이드 [14]	ㅇㅇ(119.77)	05.06	1798	13
463447	정보/ 정보/뉴스	마소CTO: OAI 모델, 전작들보다 훨씬 더 강력 등 [11]	ㅇㅇ(119.77)	05.07	2111	16
463434	일반	llm 자체가 통계 머신이라 그런거 아니냐 [4]	ㅇㅇ(1.223)	05.07	925	20
463302	일반	샘알트만 GPT6까지 미리 계획해놨다는데? [32]	ㅇㅇ	05.06	4031	23
463345	일반	Bone Biologics, NB1 임상 프로그램 진행 상황 보고 [5]	ㅇㅇ(123.141)	05.06	1153	23
463372	일반	걍 타갤처럼 비추있으면안됨? [22]	ㅇㅇ(39.124)	05.06	1599	37
463336	일반	클로드3 오푸스의 수학적 추론능력 [11]	ㅇㅇ(58.123)	05.06	1579	21
463321	일반	부패 너무 권한남용 아니냐? [47]	ㅇㅇ(61.73)	05.06	2315	40
463154	정보/ 정보/뉴스	StoryDiffusion : 일관된 이미지, 코믹스, 비디오 생성 [14]	ㅇㅇ	05.06	2689	26
463112	일반	알트만이 뒤에서 오픈소스팀 방해공작 한다는데 [12]	ㅇㅇ	05.05	1638	19
463021	일반	특이점이 반드시 와야만 하는 이유.jpg [67]	ㅇㅇ(121.142)	05.05	5264	64
462993	정보/ 정보/뉴스	테슬라봇 새로운 영상 [35]	ㅇㅇ	05.05	3995	33
462856	일반	한국 과도기 로봇 노동대체 최근일자 모음 [25]	ㅇㅇ(110.46)	05.05	3895	45
462779	일반	이 세상이 시뮬레이션이 아닌 이유.ipg [96]	ㅇㅇ(114.129)	05.04	5333	25
462748	정보/ 정보/뉴스	'AI의 대모'도 AGI 개발 동참...'공간 지능' 스타트업 설립 [11]	ㅇㅇ(182.230)	05.04	2553	20
462747	정보/ 정보/뉴스	MS, AGI 개발 위해 휴머노이드 로봇 선두 생츄어리 AI와 손잡아 [4]	ㅇㅇ(182.230)	05.04	1360	21
462719	정보/ 정보/뉴스	AI가 코딩 더 잘해"…신입 개발자 '구직난' [8]	ㅇㅇ(223.38)	05.04	616	14
462717	일반	30대 샘 X트먼 고객님 H200 GPU 출고 후기 입니다 ㅎㅎ [18]	ㅇㅇ	05.04	3325	37
462710	일반	"야동을 보면 꼬추를 만지고 싶을 것" [14]	ㅇㅇ(59.5)	05.04	4832	41