디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

ㅇㅇ(182.230) 2024.04.13 10:54:46
조회 795 추천 13 댓글 2
														

https://www.aitimes.com/news/articleView.html?idxno=158761

 



7ce88871b38307f739ef8ee14fee766f021d9faf05dc265d0e832e437d07872239d4



메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.


이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다.


벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.


오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질문 범주에 걸쳐, 집과 사무실과 같은 180개 이상의 다양한 실제 환경에 대한 1600개 이상의 질문이 포함돼 있다.


이는 AI 모델이 세상을 인지하고 상호작용하거나 인간과 자연스럽게 소통하며 일상생활에 도움을 줄 수 있는 'AI 에이전트' 개발을 돕는 것이 목표다.


예를 들어 증강현실(AR) 안경에 탑재한 AI 비서나 가정용 로봇에 이를 적용하면, 비디오 카메라나 센서에 사진을 제공하고 ‘열쇠를 어디에서 보았나요’라고 물으면 답할 수 있다.


메타 연구진은 오픈EQA 데이터셋을 구축하기 위해 실제 환경의 비디오 데이터와 3D 스캔을 수집했다. 그다음 비디오를 사람에게 보여주고 AI 에이전트에게 물어보고 싶은 질문을 작성하도록 요청했다.


그 결과로 인식 및 추론 능력을 테스트할 수 있는 1636개의 질문 세트을 구축했다.


예를 들어 ‘식탁 주위에 의자가 몇 개 있나요’라는 질문에 답하려면 AI는 장면의 객체를 인식하고, 주변이라는 공간 개념을 이해하여, 관련 객체의 수를 계산해야 한다. 경우에 따라서는 AI가 개체의 용도와 속성에 대한 기본 지식을 갖고 있어야 한다.



7ce88871b38307f739ef8ee046ee766e9404bc285f48c6d3aa34b46169d5a94ddc



AI 에이전트의 성능을 측정하기 위해 연구진은 대형언어모델(LLM)을 사용, AI 생성 답변이 인간 답변과 얼마나 유사한지 점수를 매겼다.


그 결과 'GPT-4V'와 같은 첨단 비전언어모델(VLM) 모델조차도 새로운 벤치마크인 오픈EQA에서 인간 수준의 답변을 하는 데 어려움을 겪는 것으로 나타났다. 실제로 공간 이해가 필요한 질문의 경우, 기존 VLM은 거의 ‘맹인’ 수준이라는 지적이다.


연구진은 이 벤치마크 세트를 통해 AI가 물리적인 세상을 더 잘 이해하는 방향으로 발전하기를 바란다고 밝혔다.


또 메타는 이에 앞서 지난 2월 'V-제파(Video Joint Embedding Predictive Architecture)'라는 모델을 통해 현실 세계에서 일어나는 개체 간 상호작용을 이해하고 예측할 수 있는 방법을 제시한 바 있다.


인간이 주변 세계를 배우는 방법처럼 AI도 물리적인 세계를 시각으로 경험, 수많은 텍스트 데이터를 학습하는 것보다 실질적이고 유용한 지식을 얻게 한다는 의도다. 이는 "기계 지능을 발전시키는 중요한 단계"라고 강조했다.


즉 메타는 최근 인공일반지능(AGI)으로 발전할 중요한 단서로 기존 '트랜스포머' 아키텍처와는 다른 제파 모델을 강조하고 있다. 이를 통해 AI가 사람처럼 추론하고 계획을 세울 수 있다는 설명이다.


이날 공개한 데이터셋도 이런 맥락에서 공개한 것으로 볼 수 있다.


자동등록방지

추천 비추천

13

고정닉 3

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2860 설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
459689 정보 샘알트만 스탠포드 강연 내용 번역본 [20] ㅇㅇ(119.77) 04.26 2659 20
459726 일반 미국 쓰로우플레임, 화염방사기 로봇개 출시 [20] ㅇㅇ(218.150) 04.26 1259 23
459720 일반 Gpt 4 능가한 중국의 LLM [10] ㅇㅇ(116.120) 04.26 1888 17
459693 정보 현재 AI 한계, 단점 보완 연구 및 스타트업 무쓸모행 [16] ㅇㅇ(119.77) 04.26 2665 31
459664 정보 2시간만에 다이아몬드 생산 해냄.news [10] 007빵(175.194) 04.25 848 20
459649 일반 알트만 또 하나의 업보 적립... [9] ㅇㅇ(119.77) 04.25 1671 15
459625 일반 gpt5에 대한 기대감이 크게 떨어진 사건 [1] ㅇㅇ(221.168) 04.25 1478 17
459603 정보 "애플, 수요 부족으로 비전 프로 생산 조기 중단" [28] ㅇㅇ(182.230) 04.25 2499 23
459575 정보 미드저니 ceo "향후 12개월은 실시간 3d 비디오" [9] 특술람갤로그로 이동합니다. 04.25 2224 28
459556 일반 OpenAI 4월 29일 GPT4 업그레이드 가능성 [19] 모브갤로그로 이동합니다. 04.25 2758 19
459547 일반 특갤사이클 존나 웃기다니까 [6] ㅇㅇ(106.102) 04.25 2008 49
459519 일반 스탠포드 병신이 비밀이라 했던거 [18] ㅇㅇ(119.77) 04.25 2510 21
459493 일반 알트만 씨발놈 소식은 gpt5 공개될때까지 임시 언급금지 때리면 안됨? [10] ㅇㅇ(118.33) 04.25 2416 54
459489 정보 AI 모델에서 "그것"은 데이터셋이다. [7] ㅇㅇ(61.73) 04.25 1750 24
459484 일반 이거 ㅈㄴ웃기네 [19] 헬스토끼갤로그로 이동합니다. 04.25 2506 23
459478 일반 클로드 오늘 어마어마한 업뎃함 [10] ㅇㅇ(115.138) 04.25 886 10
459429 정보 플라톤 무덤 위치 미스터리, AI로 밝혀냈다 [29] ㅇㅇ갤로그로 이동합니다. 04.25 2844 34
459224 정보 상상할 수 있는 최악의 질문을 생성한 대가로 보상을 받는 '독성 AI' [17] ㅇㅇ갤로그로 이동합니다. 04.24 1555 20
459428 정보 모더나와 OpenAI가 협력하여 생명을 구하는 치료법 개발중 [10] ㅇㅇ(211.59) 04.25 1674 24
459454 정보 데이터셋이 전부라는 OAI 증언 [12] ㅇㅇ(119.77) 04.25 2216 26
459345 정보 일론 머스크 "옵티머스 로봇, 내년에 판매 시작" [28] 니지카엘갤로그로 이동합니다. 04.24 2580 28
459453 일반 open ai에 첫 h200 도착 [27] ㅇㅇ(175.124) 04.25 1957 30
459391 정보 다리오 아모데이 "무한 데이터 생성 가능" [9] ㅇㅇ(125.191) 04.24 913 13
459370 일반 지금 OpenAI가 출시 전 준비하는 건 맞는 듯 [14] 모브갤로그로 이동합니다. 04.24 2298 24
459245 일반 챗봇아레나 라마3 소식: 계속 순위가 오름; [22] ㅇㅇ(110.145) 04.24 2458 24
459203 정보 기억에 남을 순간, 시간이 '느리게' 느껴진다 [14] ㅇㅇ(182.230) 04.24 3082 29
459195 정보 OpenAI 블로그 새 글: 아동 안전 [4] 모브갤로그로 이동합니다. 04.24 931 19
459187 정보 아마존, 75만 대 이상의 로봇을 배치해 10만 명의 인력 대체 [10] 니지카엘갤로그로 이동합니다. 04.23 2864 27
459176 일반 GPT 토큰 5억 개 학습 후 얻은 교훈들 [21] ㅇㅇ(221.157) 04.23 3566 31
459059 정보 엔비디아, 10시간 만에 '알파폴드' 훈련 완료하는 '스케일폴드' 공개 [14] ㅇㅇ(182.230) 04.23 3177 33
459058 정보 세계 최초 AI 생성 유전자 편집기 ‘오픈크리스퍼-1’ 등장 [11] ㅇㅇ(182.230) 04.23 2579 27
459057 정보 중국 손절한 UAE, 미국과 잇달아 협업...MS 이어 퀄컴과 파트너십 [4] ㅇㅇ(182.230) 04.23 970 24
459053 일반 하사비스, 소라는 넘사벽이다 인정 [3] ㅇㅇ(218.147) 04.23 1485 26
459050 정보 MS, 삼성·LG·SK·하이닉스 대표 등과 5월 회동...파트너십 구축 [4] ㅇㅇ(182.230) 04.23 1435 28
459049 일반 갤에 올라왔던 유아의 언어 습득과 LLM 관련... [12] ㅇㅇ(1.245) 04.23 1035 25
459028 정보 '한줌 흙으로'...친환경 '인간 퇴비장' 미국서 확산 [13] ㅇㅇ(182.230) 04.23 1256 18
458964 정보 Microsoft, Phi-3 발표 [18] ㅇㅇ(175.124) 04.23 2957 31
458899 정보 Meta, 퀘스트os 오픈소스 [15] ㅇㅇ(123.100) 04.23 1669 25
458401 정보 개인별 커스터마이징 가능한 "암백신" 개발중 [16] noosphere갤로그로 이동합니다. 04.21 2734 27
458785 일반 왜 '특이점이 온다'를 서점에서 팔죠..? [13] 떼껄룩해적단갤로그로 이동합니다. 04.22 3814 37
458759 일반 “K팝 이끌려 선택한 한국行, 하고 싶던 연구 맘껏” 뇌의 심장 제어 메 [8] 천재까마귀갤로그로 이동합니다. 04.22 1772 22
458758 정보 저커버그 "AI 학습 데이터보다 중요한 것은 피드백 루프" [4] ㅇㅇ(182.230) 04.22 1255 18
458703 일반 골빈해커 피셜 LLM의 미친 발전속도.jpg [10] lightvector갤로그로 이동합니다. 04.22 659 10
458659 정보 무스타파 술레이만, 인류를 위한 AI 발전 억제 주장 [9] 모브갤로그로 이동합니다. 04.22 624 19
458630 일반 선갤, 앰생몰이 거르고 인생 ㅈㄴ 고달픈 이유 [50] ㅇㅇ(125.133) 04.22 3122 32
458628 정보 ollama 포스트 : 라마3은 그렇게 검열 심하지 않은 편 [9] ㅇㅇ­갤로그로 이동합니다. 04.22 1402 17
458627 일반 FFF 저 시발련은 전략 바꿈 [9] ㅇㅇ(123.100) 04.22 437 11
458583 일반 (루머) GPT5는 5~10배 강하며, 기존 벤치마크 무의미 [29] ㅇㅇ(123.100) 04.22 4026 31
458384 정보 힌튼 "뇌를 여전히 이해하지 못할 가능성" [24] ㅇㅇ(121.132) 04.21 3724 25
458424 정보 요슈아 벤지오 인터뷰 요약 [3] ㅇㅇ(220.83) 04.21 1519 22
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2