디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시

ㅇㅇ(182.230) 2024.04.13 10:54:46
조회 803 추천 13 댓글 2
														

https://www.aitimes.com/news/articleView.html?idxno=158761

 



7ce88871b38307f739ef8ee14fee766f021d9faf05dc265d0e832e437d07872239d4



메타가 인공지능(AI) 시스템의 주변 환경 이해를 측정하기 위한 벤치마크 데이터셋을 공개했다.


이는 AI가 주변 환경에 대한 질문에 자연어로 답할 수 있는 환경 이해를 돕기 위한 것으로, 지난 2월 출시한 'V-제파(JEPA)' 모델에 이어 기존 텍스트 위주의 학습과는 다른 방법으로 AI의 지능을 끌어 올리려는 시도다.


벤처비트는 10일(현지시간) 주변 환경 이해를 측정하는 오픈 소스 벤치마크 데이터셋 ‘오픈EQA(OpenEQA)’를 출시했다고 보도했다.


오픈EQA에는 객체 및 속성 인식, 공간 및 기능 추론, 상식 지식 등 7가지 질문 범주에 걸쳐, 집과 사무실과 같은 180개 이상의 다양한 실제 환경에 대한 1600개 이상의 질문이 포함돼 있다.


이는 AI 모델이 세상을 인지하고 상호작용하거나 인간과 자연스럽게 소통하며 일상생활에 도움을 줄 수 있는 'AI 에이전트' 개발을 돕는 것이 목표다.


예를 들어 증강현실(AR) 안경에 탑재한 AI 비서나 가정용 로봇에 이를 적용하면, 비디오 카메라나 센서에 사진을 제공하고 ‘열쇠를 어디에서 보았나요’라고 물으면 답할 수 있다.


메타 연구진은 오픈EQA 데이터셋을 구축하기 위해 실제 환경의 비디오 데이터와 3D 스캔을 수집했다. 그다음 비디오를 사람에게 보여주고 AI 에이전트에게 물어보고 싶은 질문을 작성하도록 요청했다.


그 결과로 인식 및 추론 능력을 테스트할 수 있는 1636개의 질문 세트을 구축했다.


예를 들어 ‘식탁 주위에 의자가 몇 개 있나요’라는 질문에 답하려면 AI는 장면의 객체를 인식하고, 주변이라는 공간 개념을 이해하여, 관련 객체의 수를 계산해야 한다. 경우에 따라서는 AI가 개체의 용도와 속성에 대한 기본 지식을 갖고 있어야 한다.



7ce88871b38307f739ef8ee046ee766e9404bc285f48c6d3aa34b46169d5a94ddc



AI 에이전트의 성능을 측정하기 위해 연구진은 대형언어모델(LLM)을 사용, AI 생성 답변이 인간 답변과 얼마나 유사한지 점수를 매겼다.


그 결과 'GPT-4V'와 같은 첨단 비전언어모델(VLM) 모델조차도 새로운 벤치마크인 오픈EQA에서 인간 수준의 답변을 하는 데 어려움을 겪는 것으로 나타났다. 실제로 공간 이해가 필요한 질문의 경우, 기존 VLM은 거의 ‘맹인’ 수준이라는 지적이다.


연구진은 이 벤치마크 세트를 통해 AI가 물리적인 세상을 더 잘 이해하는 방향으로 발전하기를 바란다고 밝혔다.


또 메타는 이에 앞서 지난 2월 'V-제파(Video Joint Embedding Predictive Architecture)'라는 모델을 통해 현실 세계에서 일어나는 개체 간 상호작용을 이해하고 예측할 수 있는 방법을 제시한 바 있다.


인간이 주변 세계를 배우는 방법처럼 AI도 물리적인 세계를 시각으로 경험, 수많은 텍스트 데이터를 학습하는 것보다 실질적이고 유용한 지식을 얻게 한다는 의도다. 이는 "기계 지능을 발전시키는 중요한 단계"라고 강조했다.


즉 메타는 최근 인공일반지능(AGI)으로 발전할 중요한 단서로 기존 '트랜스포머' 아키텍처와는 다른 제파 모델을 강조하고 있다. 이를 통해 AI가 사람처럼 추론하고 계획을 세울 수 있다는 설명이다.


이날 공개한 데이터셋도 이런 맥락에서 공개한 것으로 볼 수 있다.


자동등록방지

추천 비추천

13

고정닉 3

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
458219 일반 얀르쿤 피셜 "오픈소스 하자고한건 맞는데 라마3 내가 직접만든건 아님" [22] ㅇㅇ(59.17) 04.21 3341 22
458194 정보/ 라마3 챗봇 아레나 근황.. [6] ㅇㅇ(123.100) 04.21 3512 23
458139 일반 이제 하다하다 야갤 유동 글을 믿네 [8] Samus갤로그로 이동합니다. 04.20 519 14
458112 정보/ 라마3 70b 초당 3000토큰 가능 [7] noosphere갤로그로 이동합니다. 04.20 2299 23
458089 정보/ (AI겨울)주커버그는 AGI가 멀었다고 생각합니다 [26] ㅇㅇ(123.100) 04.20 3974 25
458068 일반 403.. 이게 무슨 숫자인지 아시나요? [9] ㅇㅇ(59.3) 04.20 2783 31
458049 정보/ 이너코스모스, 우울증 치료하는 뇌 임플란트 출시...간단한 수술이 장점 [12] ㅇㅇ(182.230) 04.20 870 23
458019 정보/ 젠슨 황: 머지않은 미래 적절가격에 휴머노이드 보급 가능 [41] noosphere갤로그로 이동합니다. 04.20 3263 26
457991 정보/ 한국이 파운데이션 모델 '0'을 기록한 이유는 [15] ㅇㅇ(182.230) 04.20 2465 25
457974 일반 르쿤햄) 라마3 성능의 비결 [33] ㅇㅇ(121.133) 04.20 2839 28
457963 정보/ 안드레 카파시의 라마3 평가 [11] ㅇㅇ(182.230) 04.20 2266 26
457932 정보/ OpenAI 포럼 강연 - 민주적 인풋 [11] ㅁㄴㅇㄹ갤로그로 이동합니다. 04.20 298 14
457928 일반 agi 은근슬쩍 내려치기 하는 놈들이 보이네 [27] ㅇㅇ(1.237) 04.20 2694 24
457897 일반 AGI가 코앞이 아닌거 같은 이유 [78] ㅇㅇ(1.234) 04.20 4212 35
457875 일반 르쿤게이도 라마3 기여했다 [8] ㅇㅇ(123.100) 04.20 1720 23
457850 일반 정치충은 막는게 맞음 [29] ㅇㅇ(106.101) 04.20 1643 29
457839 일반 르쿤이 메타 LLM팀 아님 [7] ㅇㅇ(125.191) 04.20 1529 20
457752 일반 한 남자의 어록 모음 [37] agi2024갤로그로 이동합니다. 04.19 3157 53
457748 일반 ???: ㅋㅋ 고작 이딴걸로 좋아하네 [13] agi2024갤로그로 이동합니다. 04.19 3150 23
457691 일반 이미 로펌에서 GPT-4 로 변론서 작성중이라는데 ㅋㅋㅋㅋㅋ [13] ㅇㅇ(124.49) 04.19 2723 24
457690 일반 역시 르쿤이형이냐 [12] ㅇㅇ(59.11) 04.19 1981 56
457641 정보/ (오피셜) 라마3 곧 추가될 기능들 [15] ㅇㅇ(123.100) 04.19 2624 27
457620 일반 405B 짜리는 GPT-4 터보 걍 좆바르겠노 ㅋㅋ [8] ㅇㅇ(123.100) 04.19 2137 20
457615 일반 라마3 한국어로 쓰고 실망 ㄴㄴ [4] ㅇㅇ(123.100) 04.19 2238 19
457613 일반 챗봇아레나 라마3 성능 돌아버렸네 ㅋㅋㅋㅋㅋㅋㅋㅋ [6] ㅇㅇ(110.145) 04.19 2192 21
457608 정보/ 라마3 Chatbot arena 리더보드 순위 미쳤노ㅋㅋㅋ [4] ㅇㅇ(123.100) 04.19 1251 19
457522 정보/ MS '대화하는 얼굴' VASA-1 작동 영상 [6] ㅇㅇ갤로그로 이동합니다. 04.19 1203 22
457509 정보/ 오늘 있던 Oai 강연 + 앞로 있을 3개 [12] ㅁㄴㅇㄹ갤로그로 이동합니다. 04.19 1853 23
457496 일반 라마3 400b 성능은 gpt-4보다 훨씬 높을수도 [14] ㅇㅇ(110.145) 04.19 1669 19
457492 정보/ 학계 "딥러닝이 벽에 부딪히고 있습니다" [28] 특술람갤로그로 이동합니다. 04.19 855 13
457481 정보/ chagpt가 특정 단어를 반복하는 이유에 대한 기사가 나왔네 [17] ㅇㅇ갤로그로 이동합니다. 04.19 2305 24
457455 일반 라마3는 충분히 기뻐할만한 일 아님? [15] ㅇㅇ(211.44) 04.19 2358 46
457454 일반 라마 매력봐라 ㅅㅂㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [14] 아디라스갤로그로 이동합니다. 04.19 3405 33
457432 일반 라마3 아이폰에서 구동 성공 [15] rtOS갤로그로 이동합니다. 04.19 2642 23
457416 일반 라마4 떡밥 [3] 특술람갤로그로 이동합니다. 04.19 1047 22
457400 정보/ 스탠포드 피셜)) 분야별 ai발전 속도 인덱스 [19] lightvector갤로그로 이동합니다. 04.19 2591 27
457399 정보/ 메타 실시간 이미지 생성 발표 [9] 특술람갤로그로 이동합니다. 04.19 2737 30
457358 일반 라마3 동양인 혐오하네 ㅇㅇ [19] ㅇㅇ갤로그로 이동합니다. 04.19 3173 33
457357 일반 솔직히 라마 좃도 안기쁘면 개추 ㅋㅋ [20] ㅇㅇ(210.205) 04.19 2815 30
457344 AI창 수노3) 라마가 부른 노래 만들어봄 [8] ㅇㅇ갤로그로 이동합니다. 04.19 1242 17
457310 일반 라마3 70b 사용해볼수있게 허깅쳇에 떳다 [7] ㅇㅇ갤로그로 이동합니다. 04.19 2136 24
457304 정보/ 찬양하라ㅡMeta. [4] ㅇㅇ(123.100) 04.19 1847 28
457303 정보/ 라마3에 사용된 인간 주석데이터양 ㄷㄷㄷ [8] ㅇㅇ(123.100) 04.19 2397 20
457301 정보/ 라마2vs3 발전속도 보기.. [7] ㅇㅇ(123.100) 04.19 1971 21
457300 일반 Meta는 오픈소스 AGI를 위한 데이터센터 구축 중 [12] 모브갤로그로 이동합니다. 04.19 1379 23
457272 정보/ 오피셜) GPT4 API 사망 [6] ㅇㅇ(123.100) 04.19 3206 32
457260 일반 라마3 400b와 4터보 벤치 [8] ㅇㅇ(175.124) 04.19 1605 16
457254 일반 개념글 빨리 올려라 시발 ㅋㅋ [10] lightvector갤로그로 이동합니다. 04.19 1860 29
457232 일반 GPT4 초 멸망ㅋㅋㅋㅋ [2] ㅇㅇ(123.100) 04.19 2611 22
457213 정보/ 라마3 벤치마크 [16] ㅇㅇ(211.59) 04.19 2002 22
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2