디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] ImageInWords: 매우 상세한 이미지 설명 잠금 해제

ㅇㅇ(125.191) 2024.05.07 11:21:44
조회 39 추천 0 댓글 0
														

https://arxiv.org/abs/2405.02793


"백문이 불여일견이다"라는 오랜 속담에도 불구하고 Vision-Language 모델 학습을 위해 정확하고 매우 상세한 이미지 설명을 만드는 것은 여전히 ​​어려운 일입니다. 현재 데이터세트에는 일반적으로 웹에서 스크랩한 짧고 세분화된 설명이 있으며 시각적 콘텐츠와 관련 없는 세부정보가 포함되는 경우가 많습니다. 결과적으로, 그러한 데이터에 대해 훈련된 모델은 누락된 정보, 시각적 불일치 및 환각으로 가득 찬 설명을 생성합니다. 이러한 문제를 해결하기 위해 초상세 이미지 설명과 이 프로세스의 결과로 생성되는 새로운 데이터 세트를 관리하기 위해 신중하게 설계된 Human-In-The-Loop 주석 프레임워크인 ImageInWords(IIW)를 소개합니다. 우리는 가독성, 포괄성, 특이성, 환각 및 인간 유사성을 고려하여 데이터세트의 품질과 미세 조정에 대한 유용성에 초점을 맞춘 평가를 통해 프레임워크를 검증합니다. 우리의 데이터 세트는 최근 출시된 데이터 세트(+66%) 및 GPT-4V 출력(+48%)에 비해 이러한 차원에서 크게 향상되었습니다. 또한 IIW 데이터로 미세 조정된 모델은 동일한 인간 평가 차원에 따른 이전 작업에 비해 31% 더 뛰어납니다. 미세 조정된 모델을 바탕으로 텍스트-이미지 생성 및 비전-언어 추론도 평가합니다. 우리 모델의 설명은 자동화된 지표와 인간의 지표로 판단하여 원본에 가장 가까운 이미지를 생성할 수 있습니다. 또한 우리 모델은 구성적으로 더욱 풍부한 설명을 생성하여 ARO, SVO-Probes 및 Winoground 데이터 세트에서 최상의 기준선보다 최대 6% 뛰어난 성능을 발휘한다는 사실을 발견했습니다.


https://github.com/google/imageinwords

 


https://github.com/google/imageinwords

추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
17337 정보글 Schedule-Free Learning 선갤러(125.191) 05.28 55 0
17336 일반 GPT-5 is AGI [2] 선갤러(125.191) 05.27 174 3
17335 일반 정보글 백날 써도 아무 의미없다 [3] 선갤러(121.151) 05.27 380 22
17334 일반 지원좀 [2] ㅇㅇ(106.101) 05.27 73 0
17333 정보글 벤지오 "향후 몇 년 내에 AI 인간 뇌와 비슷한 계산능력 가질 가능성 선갤러(125.191) 05.27 94 1
17332 정보글 얀르쿤 "일반지능이란 존재하지 않아" [2] 선갤러(125.191) 05.27 129 3
17331 정보글 얀르쿤 "agi 3년 남아" [1] 선갤러(125.191) 05.27 144 7
17330 정보글 스콧 갤러웨이의 'AI 거품' 요약 ㅇㅇ(1.11) 05.27 105 9
17328 일반 특이점 왔다 ㄷㄷ [1] ㅇㅇ(172.226) 05.27 78 0
17327 일반 中 "18개월 냉동한 뇌조직 부활" [1] 인안나갤로그로 이동합니다. 05.27 83 3
17326 일반 룬 : fuck [1] ㅇㅇ(211.214) 05.27 103 3
17325 일반 로봇 도입 25년인가보네 ㅇㅇ(116.47) 05.27 91 0
17324 정보글 얀르쿤 "두머들의 망상" [1] ㅇㅇ(125.191) 05.27 94 0
17323 일반 십섹스 개섹스 좆섹스 [1] 선갤러(117.111) 05.27 67 0
17322 일반 이 한심한 놈들은 오늘도 특이점 맞이하고 있네.ㅋㅋㅋ [2] 병신®갤로그로 이동합니다. 05.27 169 14
17321 일반 기계항공공학과 교수·로멜라 로봇연구소장 데니스 홍 ② 선갤러(125.191) 05.27 59 1
17320 일반 상황예측을 잘하는것을 자연선택,진화 시키면 끝 [1] triva갤로그로 이동합니다. 05.27 61 1
17319 일반 상황예측을 잘하도록 진화시키면 끝 triva갤로그로 이동합니다. 05.27 28 0
17318 일반 진화알고리즘이 역전파알고리즘보다 수렴속도가 느려도 [4] triva갤로그로 이동합니다. 05.27 74 0
17317 일반 아아..! 진화여..!! [3] triva갤로그로 이동합니다. 05.27 74 0
17316 정보글 룬붕이 "기술의 진보는 인류의 도덕적 교화를 위한 힘" 선갤러(125.191) 05.27 52 2
17315 일반 지능을 만드는것에 대한 나의 최종결론 triva갤로그로 이동합니다. 05.27 41 0
17314 일반 2024년 반년 지났는데 달라지는게 없구나.. [4] ㅇㅇ(119.201) 05.27 123 6
17313 정보글 이세돌 9단 “AI 발전은 긍정적…두려워 말라” ㅇㅇ(125.191) 05.27 44 2
17312 정보글 Suno v3.5 얼리 엑세스 ㅇㅇ(125.191) 05.27 56 1
17311 정보글 Grokked Transformers는 암시적 추론자입니다 ㅇㅇ(125.191) 05.27 52 1
17310 정보글 전 구글X COO 모가댓 "2027까지 AGI, 2037년 10억배 똑똑 선갤러(125.191) 05.27 145 11
17309 일반 큰정보는언제 나오셈 [3] ㅇㅇ갤로그로 이동합니다. 05.27 70 0
17308 정보글 “억대 연봉? A급 인재 아니면 해고”... [1] 선갤러(125.191) 05.27 62 0
17307 일반 라이프게임의 무한 반복 [1] ㅇㅇ(125.191) 05.27 68 0
17306 정보글 FiCT는 언어모델이 간접적인 증거로부터 일반화할 수 있음을 보여줍니다. ㅇㅇ(125.191) 05.27 34 0
17305 정보글 Aya 23: 다국어 발전을 위한 오픈 웨이트 릴리스 ㅇㅇ(125.191) 05.27 37 0
17304 정보글 메타 자기지도학습을 위한 자동데이터 큐레이션: 클러스터링 기반 접근 방식 ㅇㅇ(125.191) 05.27 34 0
17303 정보글 Luban: 자율적 구현 검증을 통해 개방형 크리에이티브 에이전트 구축 ㅇㅇ(125.191) 05.27 34 0
17302 정보글 iVideoGPT: 대화형 VideoGPT는 확장 가능한 세계 모델입니다 ㅇㅇ(125.191) 05.27 51 0
17301 정보글 트랜스포머의 상황 내 학습을 인간의 일화 기억에 연결 ㅇㅇ(125.191) 05.27 37 0
17300 정보글 OMNI-EPIC: 끝없이 새로운 과제를 만들어주는 AI ㅇㅇ(125.191) 05.27 59 0
17298 정보글 내부실험실 관계자 "몇 년 동안 ai 능력 급속하게 발전할 것" 선갤러(125.191) 05.27 81 7
17297 일반 보편적 고소득 내놓으셈 [3] 특술람갤로그로 이동합니다. 05.27 83 0
17296 일반 카이스트 조교수, ‘포닥 조건 금품 갈취’ 주장 美 유명 트위터리안 고소 [1] ㅇㅇ(125.191) 05.27 147 0
17295 일반 선형쿤 [1] ㅇㅇ갤로그로 이동합니다. 05.27 58 1
17294 일반 wwdc 블룸버그 기사 [1] 선갤러(121.190) 05.27 67 1
17293 일반 어서오셈 ㅇㅇ갤로그로 이동합니다. 05.27 34 1
17292 일반 이세라 이 사람 도대체 정체가 뭐임? [1] shuwa갤로그로 이동합니다. 05.27 106 0
17291 일반 [8] ㅇㅇ(223.38) 05.27 284 16
17290 정보글 "영화처럼 AI로봇 사령부 생길 것" 선갤러(125.191) 05.26 70 0
17289 일반 ai 다 알려줬으면좋겠다 [2] (61.105) 05.26 90 0
17288 정보글 빈두 레디 "2025 agi 가능" [3] 선갤러(125.191) 05.26 145 2
17287 일반 선형충 테드 창 “AI가 진짜 지능이 있다고?…난 그렇게 생각 안 해” 선갤러(125.191) 05.26 155 0
17286 일반 화이자 dna 나노로봇 파트너십 개발 채결 shuwa갤로그로 이동합니다. 05.26 82 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2