디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

ㅇㅇ(182.230) 2024.04.13 10:54:46
조회 804 추천 13 댓글 2
														

https://www.aitimes.com/news/articleView.html?idxno=158761

 



7ce88871b38307f739ef8ee14fee766f021d9faf05dc265d0e832e437d07872239d4



메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.


이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다.


벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.


오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질문 범주에 걸쳐, 집과 사무실과 같은 180개 이상의 다양한 실제 환경에 대한 1600개 이상의 질문이 포함돼 있다.


이는 AI 모델이 세상을 인지하고 상호작용하거나 인간과 자연스럽게 소통하며 일상생활에 도움을 줄 수 있는 'AI 에이전트' 개발을 돕는 것이 목표다.


예를 들어 증강현실(AR) 안경에 탑재한 AI 비서나 가정용 로봇에 이를 적용하면, 비디오 카메라나 센서에 사진을 제공하고 ‘열쇠를 어디에서 보았나요’라고 물으면 답할 수 있다.


메타 연구진은 오픈EQA 데이터셋을 구축하기 위해 실제 환경의 비디오 데이터와 3D 스캔을 수집했다. 그다음 비디오를 사람에게 보여주고 AI 에이전트에게 물어보고 싶은 질문을 작성하도록 요청했다.


그 결과로 인식 및 추론 능력을 테스트할 수 있는 1636개의 질문 세트을 구축했다.


예를 들어 ‘식탁 주위에 의자가 몇 개 있나요’라는 질문에 답하려면 AI는 장면의 객체를 인식하고, 주변이라는 공간 개념을 이해하여, 관련 객체의 수를 계산해야 한다. 경우에 따라서는 AI가 개체의 용도와 속성에 대한 기본 지식을 갖고 있어야 한다.



7ce88871b38307f739ef8ee046ee766e9404bc285f48c6d3aa34b46169d5a94ddc



AI 에이전트의 성능을 측정하기 위해 연구진은 대형언어모델(LLM)을 사용, AI 생성 답변이 인간 답변과 얼마나 유사한지 점수를 매겼다.


그 결과 'GPT-4V'와 같은 첨단 비전언어모델(VLM) 모델조차도 새로운 벤치마크인 오픈EQA에서 인간 수준의 답변을 하는 데 어려움을 겪는 것으로 나타났다. 실제로 공간 이해가 필요한 질문의 경우, 기존 VLM은 거의 ‘맹인’ 수준이라는 지적이다.


연구진은 이 벤치마크 세트를 통해 AI가 물리적인 세상을 더 잘 이해하는 방향으로 발전하기를 바란다고 밝혔다.


또 메타는 이에 앞서 지난 2월 'V-제파(Video Joint Embedding Predictive Architecture)'라는 모델을 통해 현실 세계에서 일어나는 개체 간 상호작용을 이해하고 예측할 수 있는 방법을 제시한 바 있다.


인간이 주변 세계를 배우는 방법처럼 AI도 물리적인 세계를 시각으로 경험, 수많은 텍스트 데이터를 학습하는 것보다 실질적이고 유용한 지식을 얻게 한다는 의도다. 이는 "기계 지능을 발전시키는 중요한 단계"라고 강조했다.


즉 메타는 최근 인공일반지능(AGI)으로 발전할 중요한 단서로 기존 '트랜스포머' 아키텍처와는 다른 제파 모델을 강조하고 있다. 이를 통해 AI가 사람처럼 추론하고 계획을 세울 수 있다는 설명이다.


이날 공개한 데이터셋도 이런 맥락에서 공개한 것으로 볼 수 있다.


자동등록방지

추천 비추천

13

고정닉 3

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
464957 일반 코딩 개초보가 GPT 로 고오급 웹사이트 만들기 [41] GPT PLUS(125.137) 05.10 4641 44
464910 일반 현재 갤 상황 요약...jpg [21] lightvector갤로그로 이동합니다. 05.09 5000 38
464863 일반 장문글)내가 특이점을 기다리는 이유...txt [33] ㅇㅇ(1.238) 05.09 3138 35
464749 일반 also gpt2 쓰레긴데? [9] ㅇㅇ(114.200) 05.09 1483 14
464601 일반 also-gpt2한테 샘알트만 비판하라고 해봤는데 [16] ㅇㅇ갤로그로 이동합니다. 05.09 4002 33
464599 일반 im-good과 also모델에게 실존 인물 비방을 시켜봤다. [9] 월코존버갤로그로 이동합니다. 05.09 2512 22
464597 정보/ 구글, ‘알파폴드3’ 네이처에 공개…정확도 1.5배, DNA까지 분석 [27] ㅇㅇ(125.191) 05.09 3329 30
464587 정보/ 알파폴드 3 발표 [21] ㅇㅇ(125.191) 05.09 3392 27
464357 일반 gpt2는 검색용모델일 확률이 높음 [5] ㅇㅇ(14.53) 05.08 3208 20
464341 정보/ AI가 신약 개발에 있어 획기적 성과를 거두는중 [18] ㅇㅇ(211.59) 05.08 3558 25
464249 일반 LLM방식은 한계가 있다고 말했던 얀르쿤이 옳았던것 같으면 개추 [13] ㅇㅇ(169.150) 05.08 3282 38
464125 일반 also-gpt2나 gpt2나 코딩 실력은 gpt4를 아득히 상회함 [8] Ad_Astra갤로그로 이동합니다. 05.08 4328 21
464124 일반 also good GPT2가 클로드 완전히 찢어갈기네 걍 [2] ㅇㅇ(121.124) 05.08 4211 20
464104 일반 와 also gpt2가 클로드 압살하네 ㅋㅋㅋ [1] 아몰라(223.62) 05.08 2849 16
464050 일반 트윗 ㅋㅋㅋ GPT2 요청 한번에 게임만들기 가능 [16] ㅇㅇ(14.63) 05.08 4267 30
464038 AI창 진짜 볼 수록 지리네 [25] ㅇㅇ(119.77) 05.07 5301 42
463983 일반 agi위해선 추론이 필수적인데 조금 짜치긴 하네... [18] lightvector갤로그로 이동합니다. 05.07 2956 25
463897 정보/ also gpt로 어려운 컴퓨터 비전 대회 성공했다 [38] ㅇㅇ(119.77) 05.07 3343 34
463804 일반 방금 점프에 장애물추가 콜리전추가 원큐에성공 ㅅㅂㅋㅋㅋㅋ [22] 친근한게이브갤로그로 이동합니다. 05.07 2531 28
463784 일반 also gpt2 미침 걍 agi 2단계임 영상있음 [7] 친근한게이브갤로그로 이동합니다. 05.07 3787 27
463783 일반 지리긴 하네..ㄷㄷ 소설도 뚝딱임 [13] 라익갤로그로 이동합니다. 05.07 3556 17
463742 일반 also gpt2 일단 확실한 거는 [7] ㅇㅇ(125.137) 05.07 3945 16
463666 AI창 재미로 클로드 gpt2 시 만들어보기 [3] 포스트휴먼.갤로그로 이동합니다. 05.07 1641 15
463659 일반 also vs gpt-4 한국어 시 테스트 [29] ㅇㅇ(182.213) 05.07 2802 32
463654 일반 GPT4 원래 이렇게 삐리했나? [13] 월코존버갤로그로 이동합니다. 05.07 2457 21
463649 일반 Also 미쳤는데 ㅋㅋㅋㅋ [1] 헬스토끼갤로그로 이동합니다. 05.07 3119 15
463627 일반 also gpt2 깔끔하네 [1] ㅇㅇ갤로그로 이동합니다. 05.07 2173 14
463603 일반 약간 충격받은 also gpt-2 후기 [12] 컴퓨터비전갤로그로 이동합니다. 05.07 4420 17
463597 일반 also gpt 진짜 미쳤는데? [2] ㅇㅇ갤로그로 이동합니다. 05.07 2581 12
463587 정보/ 아레나) gpt2, gpt-4, 클로드3 사칙연산 테스트 결과 [10] ㅇㅇ갤로그로 이동합니다. 05.07 2214 17
463584 일반 ㅋㅋGPT2 작문 실력 확실히 늘어나긴했네 [3] 월코존버갤로그로 이동합니다. 05.07 2039 22
463157 정보/ 올해 말까지 테슬라 옵티머스 DoF 업그레이드 [14] ㅇㅇ(119.77) 05.06 1798 13
463447 정보/ 마소CTO: OAI 모델, 전작들보다 훨씬 더 강력 등 [11] ㅇㅇ(119.77) 05.07 2111 16
463434 일반 llm 자체가 통계 머신이라 그런거 아니냐 [4] ㅇㅇ(1.223) 05.07 925 20
463302 일반 샘알트만 GPT6까지 미리 계획해놨다는데? [32] ㅇㅇ갤로그로 이동합니다. 05.06 4031 23
463345 일반 Bone Biologics, NB1 임상 프로그램 진행 상황 보고 [5] ㅇㅇ(123.141) 05.06 1153 23
463372 일반 걍 타갤처럼 비추있으면안됨? [22] ㅇㅇ(39.124) 05.06 1599 37
463336 일반 클로드3 오푸스의 수학적 추론능력 [11] ㅇㅇ(58.123) 05.06 1579 21
463321 일반 부패 너무 권한남용 아니냐? [47] ㅇㅇ(61.73) 05.06 2315 40
463154 정보/ StoryDiffusion : 일관된 이미지, 코믹스, 비디오 생성 [14] ㅇㅇ­갤로그로 이동합니다. 05.06 2689 26
463112 일반 알트만이 뒤에서 오픈소스팀 방해공작 한다는데 [12] ㅇㅇ갤로그로 이동합니다. 05.05 1638 19
463021 일반 특이점이 반드시 와야만 하는 이유.jpg [67] ㅇㅇ(121.142) 05.05 5264 64
462993 정보/ 테슬라봇 새로운 영상 [35] ㅇㅇ갤로그로 이동합니다. 05.05 3995 33
462856 일반 한국 과도기 로봇 노동대체 최근일자 모음 [25] ㅇㅇ(110.46) 05.05 3895 45
462779 일반 이 세상이 시뮬레이션이 아닌 이유.ipg [96] ㅇㅇ(114.129) 05.04 5333 25
462748 정보/ 'AI의 대모'도 AGI 개발 동참...'공간 지능' 스타트업 설립 [11] ㅇㅇ(182.230) 05.04 2553 20
462747 정보/ MS, AGI 개발 위해 휴머노이드 로봇 선두 생츄어리 AI와 손잡아 [4] ㅇㅇ(182.230) 05.04 1360 21
462719 정보/ AI가 코딩 더 잘해"…신입 개발자 '구직난' [8] ㅇㅇ(223.38) 05.04 616 14
462717 일반 30대 샘 X트먼 고객님 H200 GPU 출고 후기 입니다 ㅎㅎ [18] ㅇㅇ­갤로그로 이동합니다. 05.04 3325 37
462710 일반 "야동을 보면 꼬추를 만지고 싶을 것" [14] ㅇㅇ(59.5) 05.04 4832 41
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2