디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 허깅페이스, 매개변수 8B짜리 멀티모달모델 ‘아이드픽스2’ 출시

ㅇㅇ(182.230) 2024.04.17 19:44:49
조회 176 추천 5 댓글 3
														

https://www.aitimes.com/news/articleView.html?idxno=158879

 



7ce8887eb28b07f739ee86e441ee7065c8ae6d31797ae8e842ea0a7feba72afe600e



허깅페이스가 텍스트 및 이미지 프롬프트에 응답할 수 있는 초경량 멀티모달언어모델(LMM)을 출시했다. 매개변수 크기가 80억개로 가장 작은 규모의 LMM 중 하나이지만, 동급 LMM 가운데 최고 성능을 기록했다는 주장이다. 


벤처비트는 16일(현지시간) 허깅페이스가 텍스트 및 이미지 프롬프트에 응답할 수 있는 80억 매개변수의 LMM ‘아이드픽스2(Idefics2)’를 출시했다고 보도했다.


이에 따르면 아이드픽스2는 딥마인드가 개발한 기술을 사용해 2023년 출시한 800억 매개변수의 ‘아이드픽스’를 기반으로 한다. 이번에는 더 작은 매개변수 크기, 오픈 라이선스, 향상된 OCR(광학 문자 인식) 등으로 업그레이드했다. 


최대 980x980 픽셀의 기본 해상도와 기본 종횡비 조작 기능을 추가했고, OCR 기능과 차트, 그림 및 문서에 대한 답변 능력을 향상했다는 설명이다.


허깅페이스는 공개적으로 사용 가능한 데이터셋, 특히 미스트랄-7B-v0.1 및 siglip-so400m-patch14-384를 혼합해 아이드픽스2를 훈련했다. 이 외에도 웹 문서, 이미지- 캡션 쌍, OCR 데이터, 렌더링된 텍스트 및 이미지-코드 데이터를 활용했다.


그 결과 라바-넥스트-미스트랄-7B, MM1-챗-7B, 딥시크-VL-7B 등 동급 LMM과의 벤치마크에서 가장 뛰어난 성능을 기록했다고 밝혔다.



7ce8887eb28b07f739ee86e44eee7169547c5e0202d16a49296c2eaaca5e7c24aa



한편 이번 출시는 경쟁업체들이 최근 최신 LMM을 공개한 가운데 이뤄졌다.


스타트업 레카는 전날 이미지, 오디오, 비디오 등 다양한 양식을 이해할 수 있는 LMM ‘레카 코어(Reka Core)’를 출시했다. 이틀 전에는 일론 머스크의 xAI가 문서, 다이어그램, 차트, 스크린샷 및 사진을 포함한 다양한 시각적 정보를 처리하는 LMM '그록-1.5V'을 공개했다.


또 지난주에는 구글이 '이마젠 2(Imagen 2)'에 텍스트 프롬프트를 애니메이션 이미지로 변환하는 '텍스트-투-라이브(text-to-live)' 기능을 공개했다.


자동등록방지

추천 비추천

5

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
470524 정보/ 라마3 400B 벤치마크 공개 & GPT-4o 발표 요약 [5] ㅇㅇ(119.197) 05.14 363 2
470522 일반 진지하게 인류의 미래는 HER 맞긴할듯 [3] 1229(1.229) 05.14 137 0
470521 일반 '오늘은 무료따리들한테 던져주는 사료' ㅇㅇ(119.77) 05.14 165 0
470520 일반 영어회화학원 끝났네 ㅋㅋ챗gpt 사만다가 왔군 연맛갤로그로 이동합니다. 05.14 85 0
470519 일반 근데 외국어 공부 쉬워진다는 말도 좀 웃긴데 [3] ㅇㅇ(220.116) 05.14 192 0
470518 일반 난 이제 저거 탑재된 휴머노이드 로봇이 어케될까 너무 궁금함.. [1] ㅇㅇ(125.137) 05.14 59 0
470517 일반 며칠후) 생각보다 구린데? 특들갑이었는데? ㅇㅇ(218.152) 05.14 63 0
470516 일반 진짜 오픈ai 공홈에 올라온 영상들이 개지리네 ㅋㅋㅋ [1] ㅇㅇ갤로그로 이동합니다. 05.14 152 0
470515 일반 그놈의 초기 버전 정작 벤치마크는 3월 버전이랑 ㅇㅇ(218.154) 05.14 35 0
470514 일반 저 클로드3 갔다가 지금 재구독했는데 ㅎㅎ; [5] ㅇㅇ갤로그로 이동합니다. 05.14 217 0
470513 일반 ai겨울이네 더 없냐? ㅇㅇ(121.184) 05.14 21 0
470512 일반 영어 회화충으로 너무 행복하다ㅋㅋㅋㅋ [1] ㅇㅇ(121.143) 05.14 167 0
470511 일반 기술 발전 좆돼게 빨라지긴 했다 ㅇㅇ갤로그로 이동합니다. 05.14 46 0
470510 일반 2027 agi 선형충이면 개추 ㅋㅋㅋㅋ [5] ㅇㅇ(59.31) 05.14 134 3
470508 일반 일단 다음 폰은 아이폰인걸로 ㅇㅇ(115.139) 05.14 56 0
470507 일반 오픈ai 유튜브 영상 올라온거 개지리네 진짜 ㅇㅇ(182.212) 05.14 73 0
470506 일반 얀르쿤 : "여전히 저건 진짜 '지능' 이 아냐" [8] ㅇㅇ갤로그로 이동합니다. 05.14 435 10
470505 일반 Openai 공식 유튜브 영상들 재밌네 [2] ㅇㅇ(61.72) 05.14 123 0
470504 일반 지금 gpt4 o 가 제일 좋은거임? [2] 나미부갤로그로 이동합니다. 05.14 132 0
470502 일반 난 이제 모르겠다 그냥 살랜다 1229(1.229) 05.14 67 0
470501 일반 지리는건 다음달이면 이건 당연한거고 지루한게 되어있을듯 ㅇㅇ(125.133) 05.14 65 0
470500 일반 also 어디서 씀? [7] 비닌갤로그로 이동합니다. 05.14 273 0
470499 일반 2시 땡쳤을땐 욕밖에없어서 자러갓다가 잠안와서 다시 왔는데ㅔ [1] ㅇㅇ(121.134) 05.14 128 0
470498 일반 와 선형충인데 오늘 박살났네 ㅇㅇ(125.133) 05.14 213 0
470497 일반 내 생각에 무료로 푼건 미국 입김도 있긴했을듯 ㅇㅇ(175.213) 05.14 111 0
470496 일반 대단한거임? ai ㅈ도 모르는데... 어느정도 파급력임? [18] ㅇㅇ갤로그로 이동합니다. 05.14 405 0
470495 일반 게임 애니 적용되는건 확정이지? [2] ㅇㅇ(112.147) 05.14 110 0
470494 일반 아니 시발 나 이틀전에 rog g18 노트북 삿다가 [5] ㅇㅇ(121.124) 05.14 122 0
470493 일반 그니깐 정리하면 ㅇㅇ(123.213) 05.14 60 0
470492 일반 GPT-4o는 3시간당 80개 메세지 가능 [20] ㅇㅇ(175.208) 05.14 4587 25
470491 일반 아이폰이나 애플이랑만 가능할거라고 생각하는건 너무 근시안적인거아니냐 [1] ㅇㅇ(39.113) 05.14 131 0
470490 일반 저거 정식버전 나오면 연예인 비서 만들기 쌉가능? ㅇㅇ갤로그로 이동합니다. 05.14 40 0
470489 일반 솔직히 요즘 드는 생각이 내가 죽기전에 오기는할련지 ㅇㅇ(125.181) 05.14 70 0
470486 일반 “료이키텐카이“ ㅇㅇ(222.97) 05.14 97 0
470485 일반 Q*모델이 적용이 된건가 [2] ㅇㅇ(123.213) 05.14 126 0
470484 일반 난 태어나서 컴퓨터랑 말로 "대화"한거 처음 봄. ㅇㅇ(218.232) 05.14 205 4
470483 일반 와 미친 드디어 초2때부터야동본놈(116.36) 05.14 67 0
470481 일반 역사에 남을 하루를 보냈으면 개추 ㅇㅇ갤로그로 이동합니다. 05.14 38 2
470480 일반 chat gpt도 가격절반 적용될까? [2] ㅇㅇ(58.29) 05.14 136 0
470479 일반 이번 발표 요약...........jpg [7] 수퍼고수(110.10) 05.14 525 8
470478 일반 인공지능개발자는모함? [6] ㅇㅇ(112.169) 05.14 150 0
470477 일반 개추가 저절로 눌러지는 짤 ㅇㅇ(211.168) 05.14 76 0
470476 일반 와 영상통화 중 생일 눈치채고 노래불러주네 [4] ㅇㅇ(218.147) 05.14 209 3
470475 일반 클로드 이제 좆퇴물이냐? [10] ㅇㅇ(61.98) 05.14 291 3
470474 일반 알못인데 최근 갑자기 발전하는 이유가 뭐임? [8] ㅇㅇ(124.50) 05.14 183 0
470473 일반 소신발언) 근데 결국 트래픽 몰리면 지연존나되는거아닌가 싶은 [1] ㅇㅇ(59.17) 05.14 81 0
470472 일반 전페이팔 ceo gpt5 노동대체 썰 이거 존나 신빙성 있는거 같다 [1] ㅇㅇ갤로그로 이동합니다. 05.14 162 0
470471 일반 시발 아이폰 살걸 [7] alphaca갤로그로 이동합니다. 05.14 384 0
470470 일반 속도는 이정도면 됐다 이제 무게를 줄여야한다 언어모델갤로그로 이동합니다. 05.14 41 0
470469 일반 진지하게 사표 고민중임 [1] ㅇㅇ(125.133) 05.14 149 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2