디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 생각의 시각화는 대규모 언어 모델에서 공간 추론을 이끌어냅니다.

ㅇㅇ(125.191) 2024.04.08 00:01:18
조회 359 추천 10 댓글 10
														
대형 언어 모델(LLM)은 언어 이해와 다양한 추론 작업에서 인상적인 성능을 보여주었다. 그러나 인간의 인지에 있어 중요한 측면인 공간 추론 능력은 상대적으로 충분히 탐구되지 않았다. 인간은 '마음의 눈'으로 알려진 과정을 통해 보이지 않는 물체와 행동에 대한 심상을 만드는 놀라운 능력을 가지고 있어, 보이지 않는 세계를 상상할 수 있게 한다. 이러한 인지 능력에 영감을 받아 우리는 Visualization-of-Thought(VoT) 프롬프팅을 제안한다. VoT는 추론 과정을 시각화하여 LLM의 공간 추론을 이끌어내고, 이를 통해 후속 추론 단계를 안내하는 것을 목표로 한다. 우리는 자연어 내비게이션, 시각적 내비게이션, 2D 그리드 월드에서의 시각적 타일링 등 다중 홉 공간 추론 작업에 VoT를 적용하였다. 실험 결과, VoT는 LLM의 공간 추론 능력을 크게 향상시키는 것으로 나타났다. 특히 VoT는 이러한 작업에서 기존의 멀티모달 대형 언어 모델(MLLM)보다 우수한 성능을 보였다. VoT가 LLM에서 놀랍도록 잘 작동하는 반면, 공간 추론을 용이하게 하기 위해 '정신 이미지'를 생성하는 능력은 마음의 눈 과정과 유사하여, MLLM에서도 잠재적인 실행 가능성을 시사한다.


자동등록방지

추천 비추천

10

고정닉 5

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
465785 일반 chatgpt 플레이스토어에서 다운받으면 HET 체험가능함 ㅇㅇ(211.192) 05.11 99 0
465784 일반 Gpt5보다 멋지다는 찌라시 ㅇㅇ(117.111) 05.11 149 2
465783 일반 @@ Her <-- 간단 요약 [1] 특탁(112.160) 05.11 336 1
465781 일반 인간수준의 인공지능을 만드는것이 불가능에 가까운 이유.jpg [5] ㅇㅇ(14.38) 05.11 265 1
465779 일반 자연스러운 인간 목소리와 얼굴표정을 가진 [1] ㅇㅇ(114.202) 05.11 93 0
465777 일반 gpt5보다 멋지다고? [1] ㅇㅇ(14.53) 05.11 142 0
465776 일반 GPT2 ALSO가 훨씬 좋은 이유가 딩둘딩갤로그로 이동합니다. 05.11 158 0
465775 일반 gpt2 also 어디갔냐 씨발 [1] 딩둘딩갤로그로 이동합니다. 05.11 229 0
465773 일반 완몰가는 ai가 뇌를 100퍼 컨트롤할줄 알아야 가능한거라면 [2] ㅇㅇ(39.116) 05.11 144 0
465772 정보/ OAI 연구원 : "GPT5보다 멋질 것" [25] ㅇㅇ(118.235) 05.11 4126 17
465771 일반 클로드가 성능 제일 낫나? [2] ㅇㅇ(122.153) 05.11 96 0
465770 일반 완몰가는 2045에나 가능하지 않을까 [7] ㅇㅇ(110.46) 05.11 131 0
465768 일반 gpt2 똑똑하다 ㅇㅇ(211.244) 05.11 91 0
465767 일반 her얘기나오는데 먼떡밥임 [2] ㅇㅇ(223.39) 05.11 300 0
465766 일반 이거 보니까 갑자기 숨이 턱막힘 [9] ㅇㅇ(1.249) 05.11 399 2
465765 일반 hey 특붕, 한국시간은 월요일이 아니고 화요일라구! ㅇㅇ(183.105) 05.11 62 0
465764 일반 특이점오면 날씨제어도 ㄱㄴ? [1] ㅇㅇ(118.235) 05.11 72 0
465763 일반 오늘도 노동해방과 특이점을 향한 기도를 올립니다 [3] ㅇㅇ(219.240) 05.11 75 0
465762 일반 특이점갤에 쓰는 아날로그 글 [3] ㅇㅇ(219.240) 05.11 87 1
465761 일반 그래서 월요일엔 agi만 나오고 끝이라는거지? [3] ㅇㅇ(118.235) 05.11 158 0
465758 일반 월요일까지 겨울이네... [4] ㅇㅇ(121.124) 05.11 111 0
465755 일반 지금 사람들이 착각하는게 [3] ㅇㅇ(117.20) 05.11 376 0
465754 일반 그래서 agi는 언제나오나요 ㅇㅇ(115.139) 05.11 48 0
465753 일반 워렌버핏 불쌍하다 [5] ㅇㅇ(125.180) 05.11 257 1
465752 일반 알트만 게이 여유로운거 보니까 내부 agi 있을듯 [1] ㅇㅇ(175.209) 05.11 173 1
465751 일반 이루다랑도 연애하는데 openai는 왜 안된다고 생각하냐? [1] 딩둘딩갤로그로 이동합니다. 05.11 149 0
465750 일반 24살 잔고 ㅁㅌㅊ? [11] ㅇㅇ(180.226) 05.11 448 1
465748 일반 장기기억에 대한 실마리도 없는데 뭔 her 임 ㅋㅋㅋㅋㅋ [3] ㅇㅇ(125.134) 05.11 245 1
465747 일반 근데 her나와도 연애는 아직 좀 시기상조 아님? [2] ㅇㅇ(220.83) 05.11 165 0
465744 일반 그래서 이번 발표때 AGI 엑조디아 뭐뭐 나오는데 ㅇㅇ(121.124) 05.11 61 0
465742 일반 갤이 Her로 도배돼있네 [3] ㅇㅇ갤로그로 이동합니다. 05.11 212 0
465741 일반 만약에 VR 기기랑 AI가 연결된다면 [2] 천사다천사갤로그로 이동합니다. 05.11 131 0
465740 일반 Chat GPT 플러스 모바일로 결제해도 PC에서 이용 가능함? [4] ㅇㅇ갤로그로 이동합니다. 05.11 130 0
465739 일반 보이스엔진으로 아나운서 성우 상담사 완전대체 가능? [6] ㅇㅇ(124.56) 05.11 142 0
465738 일반 음성으로 아이폰 조작하는 정도면 GPT-4 수준으로 할 수 있을 듯 ㅇㅇ(120.142) 05.11 62 0
465737 일반 근데 스마트폰에 수준급 온디바이스 ai 탑재되면 진짜 편할듯 [2] ㅇㅇ갤로그로 이동합니다. 05.11 107 0
465735 일반 GPT5는 AGI 엑조디아 다 모으고 나서 출시할듯 [3] ㅇㅇ갤로그로 이동합니다. 05.11 256 2
465733 일반 GPTs도 1시간 대화제한잇음>? ㅇㅇ(218.146) 05.11 54 0
465732 일반 장기기억은 어떻게 하려고 her 특들갑이야 [1] ㅇㅇ갤로그로 이동합니다. 05.11 142 0
465731 일반 나는 gpt의 지능 자체가 업그레이드 되는걸 원하는데 천사다천사갤로그로 이동합니다. 05.11 86 1
465730 일반 미소노 미카랑 결혼하는게 꿈이다 [1] ㅇㅇ(211.246) 05.11 98 0
465729 일반 특이점이 온다. ㅇㅇ(1.239) 05.11 37 0
465727 일반 her 보면서 이상하게 여겼던 부분 [3] ㅇㅇ(119.207) 05.11 194 0
465726 일반 한가지 확실한건 사람이랑 구분 불가능한건 확실하다 ㅇㅇ(117.20) 05.11 85 0
465724 일반 her 나오면 진짜 다 설득 당해서 좆될 수 있음 ㄷㄷ [3] ㅇㅇ(121.188) 05.11 281 0
465723 일반 Agi 뭐 진척된 거 있음? [4] ㅇㅇ갤로그로 이동합니다. 05.11 156 0
465722 일반 세상이 바뀔 거대한 뭔가가 오긴 오나보다 [2] ㅇㅇ(218.147) 05.11 167 0
465720 일반 이번에 voice engine 나온다는거라고 보면 될거같음 딩둘딩갤로그로 이동합니다. 05.11 87 0
465718 일반 이번 gpt2가 gpt4보다 압도적으로 좋음? [3] ㅇㅇ갤로그로 이동합니다. 05.11 175 0
465717 일반 openai가 애플이랑 협업 할 이유 없는게 [1] 딩둘딩갤로그로 이동합니다. 05.11 121 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2