디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 인간 수준의 객체 인식 능력을 달성하는 데 필요한 것은 확장뿐

ㅇㅇ(125.191) 2024.04.28 21:23:17
조회 202 추천 3 댓글 5
														

https://arxiv.org/abs/2308.03712


인간과 같은 시각적 경험을 통해 인간 수준의 객체 인식 능력을 달성하는 데 필요한 것은 확장뿐일 수 있습니다.


이 논문에서는 현재의 자기 지도 학습 방법이 충분히 확장된다면 인간이 배우는 것과 동일한 유형과 양의 시각적 경험으로 인간 수준의 시각적 개체 인식 기능에 도달할 수 있는지 묻습니다. 이 질문에 대한 이전 연구에서는 데이터 크기의 확장만 고려했습니다. 여기서는 데이터 크기, 모델 크기 및 이미지 해상도의 동시 확장을 고려합니다. 우리는 최대 476x476 픽셀의 이미지 해상도를 갖춘 최대 5,000시간의 인간과 유사한 비디오 데이터(장시간 연속, 대부분 자기 중심적 비디오)로 훈련된 최대 633M 매개변수 크기(ViT-H/14)의 비전 변환기를 사용하여 스케일링 실험을 수행합니다. . 자기 지도 학습 알고리즘인 MAE(Masked Autoencoder)의 효율성 덕분에 적은 학비로 이 확장 실험을 실행할 수 있습니다. 우리는 모델 크기, 데이터 크기 및 이미지 크기의 인간 이하 규모에서 이러한 요소가 동시에 확장되면 인간 수준의 객체 인식 능력에 도달하는 것이 가능하다는 것을 발견했습니다. 구체적인 예를 들자면, 952x952 픽셀의 공간 해상도를 갖춘 인간과 유사한 20,000시간(2.3년)의 비디오 데이터로 훈련된 2.5B 매개변수 ViT 모델이 ImageNet에서 대략 인간 수준의 정확도에 도달할 수 있어야 한다고 추정합니다. 따라서 인간 수준의 역량은 실질적인 귀납적 편견 없이 매우 일반적인 학습 알고리즘 및 아키텍처를 사용하여 인간과 유사한 지각 경험(양과 유형 모두에서 인간과 유사)을 통해 근본적인 지각 능력을 달성할 수 있습니다.


헹가래


자동등록방지

추천 비추천

3

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
470471 일반 시발 아이폰 살걸 [7] alphaca갤로그로 이동합니다. 05.14 384 0
470470 일반 속도는 이정도면 됐다 이제 무게를 줄여야한다 언어모델갤로그로 이동합니다. 05.14 41 0
470469 일반 진지하게 사표 고민중임 [1] ㅇㅇ(125.133) 05.14 149 0
470468 일반 GPT4처럼 성능저하는 없겠지? [2] ㅇㅇ(222.105) 05.14 108 0
470467 일반 이쯤에서 특갤 민심 테스트 간다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [15] lightvector갤로그로 이동합니다. 05.14 3361 70
470466 일반 구글이 조작한걸 OAI는 실시간 시연한게 웃김 [4] ㅇㅇ갤로그로 이동합니다. 05.14 275 3
470464 일반 오픈ai 유튜브가서 영상보셈 [1] ㅇㅇ(112.186) 05.14 135 0
470463 일반 구독 끊고 클로드로 갈아탔는데 시발 미안하다 [1] ㅇㅇ(58.29) 05.14 112 1
470462 일반 "이제 내일 출근은 어떻게 하나 걱정하고 계십니까?" [3] ㅇㅇ갤로그로 이동합니다. 05.14 181 1
470461 일반 무료 유료 사용량 차이인가? [1] ㅇㅇ(210.222) 05.14 103 0
470460 일반 저거 피규어에 탑재하면 게임 끝 아닌가??? ㅇㅇ갤로그로 이동합니다. 05.14 54 0
470459 일반 근데 하루종일 also 체감 안된다한 애한테 물어보고 싶음 [10] ㅇㅇ(175.213) 05.14 265 0
470458 일반 GPT4o의 레이턴시는 '인간수준' [3] ㅇㅇ(119.207) 05.14 314 5
470457 일반 이제 갤럭시 유기해야됨? ㅇㅇ갤로그로 이동합니다. 05.14 184 1
470456 일반 그래서 으흐흐한 대화는 가능한거임? 급함 [1] ㅇㅇ(1.243) 05.14 57 0
470455 일반 워프는 21세기 안으로 가능할거 같냐? [3] ㅇㅇ(110.15) 05.14 81 0
470454 일반 이 영상이 연출이 아니라 진짜라면 교육업계가 바뀌겠네 [4] ㅇㅇ(220.116) 05.14 219 0
470453 일반 지금 제일 걱정인 거 ㅇㅇ갤로그로 이동합니다. 05.14 41 0
470452 일반 gpt4 o 지금 돈내야 쓸수있는거니?? 도움좀 ㅠㅠ [3] 나미부갤로그로 이동합니다. 05.14 136 0
470451 일반 이게이런뜻이었군.. [2] ㅇㅇ(58.29) 05.14 173 3
470450 일반 오늘은 고작 무료 모델일 뿐이다 ㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.14 186 0
470449 일반 worldcoin 산다는 넘들은 어케됐으려나 [1] ㅇㅇ(218.237) 05.14 83 0
470448 일반 목소리 셀프튜닝되면 지릴듯 영화하나 학습시켜서 [1] ㅇㅇ(125.133) 05.14 111 0
470447 일반 역사가 바뀐 순간을 직관한 10만명중 1인이면 개추 ㅋㅋ ㅇㅇ(112.187) 05.14 76 1
470446 일반 이정도면 구글도 1.5 ultra 잘나오면 비빌만 하겠네 ㅇㅇ(221.155) 05.14 65 0
470443 일반 김모씨 아침 정치 유튜브 생방이 실시간 20만인데. [1] ㅇㅇ(218.232) 05.14 118 0
470442 일반 그래서 gpt5는 언제나오냐? ㅇㅇ(121.124) 05.14 31 0
470441 일반 ㅇㅇ ㅇㅇ(220.116) 05.14 25 0
470440 일반 한달뒤가 궁금 갤럭시빠갤로그로 이동합니다. 05.14 39 0
470438 일반 아침 헤드라인 예상 open ai 새로운 모델 발표...특이점 오나? ㅇㅇ(125.133) 05.14 61 0
470437 일반 4o 무료로 공개한다는 거임? [4] ㅇㅇ(222.235) 05.14 217 0
470436 일반 챗gpt 결제중인데 gpt4o 난 안뜬다 [5] ㅇㅇ(58.239) 05.14 196 0
470435 일반 다들 영어 못하는 게이들만 있냐? 왜 자꾸 무료인거 갖고 난리임 [4] 프론트백가능갤로그로 이동합니다. 05.14 170 0
470434 일반 근데 특이점 와도 돈없는애들은 더 최악아님? [8] ㅇㅇ(183.96) 05.14 123 0
470433 일반 2주뒤 특갤) 4o 나오고 한참 됐는데 뭐 없나? 춥다... [4] ㅇㅇ갤로그로 이동합니다. 05.14 171 0
470431 일반 솔직히 GPT3 4 발표보다 이게 더 영향력 커보임 [1] 1229(1.229) 05.14 144 0
470430 일반 이거 보고도 전쟁이 하고싶을까?? [1] ㅇㅇ(125.133) 05.14 153 1
470429 일반 비전으로 ui/ ux도 설계하겠네 탈조선갤로그로 이동합니다. 05.14 45 0
470427 일반 아직 특이점 올려면 한참 멀었구만 왜케 호들갑임? ㅇㅇ(49.169) 05.14 51 0
470426 일반 난 진짜 라이브 첨 봣는데 ㅇㅇ(121.124) 05.14 64 0
470425 일반 그러면 chat arena에서 also버전은 내려가는거야? ㅇㅇ(114.204) 05.14 59 0
470423 일반 나스닥에 숏친 딸피 새끼들이 심심이다 ㅇㅈㄹ ㅇㅇ갤로그로 이동합니다. 05.14 41 0
470422 일반 갑자기 국제 정세가 걱정되기 시작했어 ㅇㅇ갤로그로 이동합니다. 05.14 129 0
470420 일반 홈페이지랑 유튜브 비디오랑 다 보고 느낀거 루미코드갤로그로 이동합니다. 05.14 93 1
470419 일반 중요한 건, 새로 훈련한 싱글 end-to-end 멀티모달 모델인데 [1] 빙냥이ㄱㅇㅇ갤로그로 이동합니다. 05.14 98 0
470418 일반 알트만 주장 10년안에 노동대체 이거 100% 온다 ㅇㅇ갤로그로 이동합니다. 05.14 158 0
470417 일반 유튜브썸네일예상)경악! 인간의사고를읽다?! 디스토피아의 시작!!!!!!! ㅇㅇ(1.243) 05.14 40 0
470416 일반 난리줜나떠네 [1] 00(14.37) 05.14 108 0
470415 일반 구글번역기랑 gpt 번역이랑 뭐가 다름? [1] dd(183.114) 05.14 130 0
470414 일반 5에 대한 기대만 커지네 ㅇㅇ(112.186) 05.14 36 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2