디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 생각의 시각화는 대규모 언어 모델에서 공간 추론을 이끌어냅니다.

ㅇㅇ(125.191) 2024.04.08 00:01:18
조회 357 추천 10 댓글 10
														
대형 언어 모델(LLM)은 언어 이해와 다양한 추론 작업에서 인상적인 성능을 보여주었다. 그러나 인간의 인지에 있어 중요한 측면인 공간 추론 능력은 상대적으로 충분히 탐구되지 않았다. 인간은 '마음의 눈'으로 알려진 과정을 통해 보이지 않는 물체와 행동에 대한 심상을 만드는 놀라운 능력을 가지고 있어, 보이지 않는 세계를 상상할 수 있게 한다. 이러한 인지 능력에 영감을 받아 우리는 Visualization-of-Thought(VoT) 프롬프팅을 제안한다. VoT는 추론 과정을 시각화하여 LLM의 공간 추론을 이끌어내고, 이를 통해 후속 추론 단계를 안내하는 것을 목표로 한다. 우리는 자연어 내비게이션, 시각적 내비게이션, 2D 그리드 월드에서의 시각적 타일링 등 다중 홉 공간 추론 작업에 VoT를 적용하였다. 실험 결과, VoT는 LLM의 공간 추론 능력을 크게 향상시키는 것으로 나타났다. 특히 VoT는 이러한 작업에서 기존의 멀티모달 대형 언어 모델(MLLM)보다 우수한 성능을 보였다. VoT가 LLM에서 놀랍도록 잘 작동하는 반면, 공간 추론을 용이하게 하기 위해 '정신 이미지'를 생성하는 능력은 마음의 눈 과정과 유사하여, MLLM에서도 잠재적인 실행 가능성을 시사한다.


자동등록방지

추천 비추천

10

고정닉 5

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
467078 일반 자꾸 gpt4 초기 버전이 더 좋았다고 하는 애들 좀 빡통 같음..ㅋㅋ [1] ㅇㅇ(125.137) 05.13 118 1
467077 일반 하다하다 구독자수로 억까를 하노 [2] ㅇㅇ(119.198) 05.13 109 0
467076 일반 음성 인식이면 걍 어플로도 되는거잖아 [1] ㅇㅇ(218.154) 05.13 68 0
467075 일반 챗지피티 이미 음성채팅 가능하잖아 [1] ㅇㅇ(110.46) 05.13 148 0
467074 일반 사만다가 기대가 되면서 안되는 부분 [3] 특붕이(115.77) 05.13 119 0
467073 일반 음성채팅 진짜야? 제발 아니라고 해줘 ㅇㅇ(121.140) 05.13 82 0
467072 일반 갤 반응 왜이래데 [1] ㅇㅇ(218.154) 05.13 123 1
467071 일반 구독 박았다 ㅇㅇ갤로그로 이동합니다. 05.13 83 0
467070 일반 음성채팅 하나가지고 호들갑 너무 심하네 [2] ㅇㅇ(210.95) 05.13 157 1
467069 일반 어그로 이렇게 끌었는데 대화 딜레이 3초 이상이면 [1] 분탕치러온거아님갤로그로 이동합니다. 05.13 92 0
467068 일반 open ai 메인 페이지 이쁘게 꾸몄네 [2] dd갤로그로 이동합니다. 05.13 251 2
467067 일반 싸우든 아니든 질삭은 노매너 아니냐 ㅇㅇ갤로그로 이동합니다. 05.13 40 1
467066 일반 지금 올라오는 글 다 캡쳐하면 [3] ㅇㅇ(211.57) 05.13 92 0
467065 일반 알트만 발표 이런식이면 어캄 [3] 특붕이(115.77) 05.13 150 0
467064 일반 일단 her 다시 봄 ㅇㅇ갤로그로 이동합니다. 05.13 61 0
467063 일반 이 새끼들 구독자 겨우 88만 따리인게 웃기노 ㅋㅋㅋ [5] ㅇㅇ갤로그로 이동합니다. 05.13 295 0
467062 일반 오픈ai 연구원들이 마법이라고 입을 터는데 기대 해야지 [1] ㅇㅇ갤로그로 이동합니다. 05.13 165 0
467061 일반 내 여친 탄생 9시간 전 [1] ㅇㅇ(110.46) 05.13 99 2
467060 일반 오픈AI 도 이제 비지니스 모델을 출시하네 에포닌갤로그로 이동합니다. 05.13 75 0
467059 일반 ㅅㅂ 사만다 나온다고? [3] noosphere갤로그로 이동합니다. 05.13 128 0
467058 일반 챗봇아레나 good / also 팁 [9] ㅇㅇ(210.106) 05.13 489 2
467057 일반 그래서 내일 뭐나온느거? [2] noosphere갤로그로 이동합니다. 05.13 66 0
467055 일반 her 나오기 까지 9시간 남았다 [3] ㅇㅇ갤로그로 이동합니다. 05.13 128 0
467054 일반 음성비서 ai인거 확정났나보네 ㅇㅇ(1.176) 05.13 112 0
467052 일반 1달뒤 예상 >>>나도 아직 사만다 못받음 ㅋㅋ [8] et갤로그로 이동합니다. 05.13 212 0
467051 일반 세상의 끝에 디다른 기분 [1] et갤로그로 이동합니다. 05.13 89 0
467050 일반 발전속도가 빠른거 같기도 느린거 같기도... 특붕이(115.77) 05.13 56 0
467049 일반 챗GPT4 대화모드가 드디어 사만다모드가 되는구나 [4] 연맛갤로그로 이동합니다. 05.13 168 0
467048 일반 근데 OAI가 devday이후로 발표하겠다하고 발표한건 처음아닌가? [2] dd갤로그로 이동합니다. 05.13 121 0
467047 일반 나다 싶으면 당장 가서 구독 박아둬라 [4] ㅇㅇ갤로그로 이동합니다. 05.13 154 0
467045 일반 그래서 사만다2 언제나옴? ㅇㅇ(110.46) 05.13 46 0
467044 일반 지금 오픈AI발표가지고 온갖 호들갑 다 떨어놓고 [3] ㅇㅇ(121.163) 05.13 178 0
467043 일반 무료유저인데 내일부터 gpt결제하면 됨? [4] ㅇㅇ(211.119) 05.13 249 0
467041 일반 홍채를 판다는게 무슨 소리냐 [5] ㅇㅇ(183.97) 05.13 165 0
467040 일반 기대컨해라 [3] ㅇㅇ(116.34) 05.13 95 0
467039 일반 후회하지말고 얼른 홍채팔자 [1] ㅇㅇ갤로그로 이동합니다. 05.13 130 0
467038 일반 ㅆㅃ 오늘 14시인줄 알았네 [2] ㅇㅇ갤로그로 이동합니다. 05.13 132 0
467036 일반 also랑 gpt-4 초기랑 비슷하다 이 지랄하네 ㅋㅋ [31] ㅇㅇ(106.247) 05.13 3408 30
467035 일반 LLM 사칙연산 잘하게 하는법 [11] ㅇㅇ갤로그로 이동합니다. 05.13 257 4
467033 일반 홍채 팔고 왔다... [4] ㅇㅇ(1.201) 05.13 326 0
467032 일반 아직도 의심하는 병신 있나? [13] ㅇㅇ(117.20) 05.13 349 0
467031 일반 성능 저하는 그냥 도파민이 빠지는게 제일 큼 [2] ㅇㅇ(218.154) 05.13 157 1
467030 일반 1.5 울트라도 공개함 ?ㄷ ㅇㅇ(218.154) 05.13 75 0
467029 일반 임시채팅 이거 머임 gpt [4] 케이프타운의무법자갤로그로 이동합니다. 05.13 307 0
467028 일반 이 뉴스 뭐냐? [2] ㅇㅇ갤로그로 이동합니다. 05.13 162 0
467026 일반 라마3 다국어 모델 빨리 내놓으라고 ㅇㅇ(110.145) 05.13 43 0
467025 일반 곧 제미나이 1.5 울트라 공개할텐데 그래서 OAI가 공개하는건데 연맛갤로그로 이동합니다. 05.13 99 0
467023 일반 챗봇 아레나 ㅇㅇ(168.188) 05.13 51 0
467022 일반 설레발 보니까 왜 아키에이지 오픈전 생각나지 [3] 카탁프락T갤로그로 이동합니다. 05.13 165 0
467021 일반 ㄹㅇ 사만다급이면 야한거 할 때는 전원off시켜야겠네 [4] ㅇㅇ(218.147) 05.13 295 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2