디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 인간 수준의 객체 인식 능력을 달성하는 데 필요한 것은 확장뿐

ㅇㅇ(125.191) 2024.04.28 21:23:17
조회 194 추천 3 댓글 5
														

https://arxiv.org/abs/2308.03712


인간과 같은 시각적 경험을 통해 인간 수준의 객체 인식 능력을 달성하는 데 필요한 것은 확장뿐일 수 있습니다.


이 논문에서는 현재의 자기 지도 학습 방법이 충분히 확장된다면 인간이 배우는 것과 동일한 유형과 양의 시각적 경험으로 인간 수준의 시각적 개체 인식 기능에 도달할 수 있는지 묻습니다. 이 질문에 대한 이전 연구에서는 데이터 크기의 확장만 고려했습니다. 여기서는 데이터 크기, 모델 크기 및 이미지 해상도의 동시 확장을 고려합니다. 우리는 최대 476x476 픽셀의 이미지 해상도를 갖춘 최대 5,000시간의 인간과 유사한 비디오 데이터(장시간 연속, 대부분 자기 중심적 비디오)로 훈련된 최대 633M 매개변수 크기(ViT-H/14)의 비전 변환기를 사용하여 스케일링 실험을 수행합니다. . 자기 지도 학습 알고리즘인 MAE(Masked Autoencoder)의 효율성 덕분에 적은 학비로 이 확장 실험을 실행할 수 있습니다. 우리는 모델 크기, 데이터 크기 및 이미지 크기의 인간 이하 규모에서 이러한 요소가 동시에 확장되면 인간 수준의 객체 인식 능력에 도달하는 것이 가능하다는 것을 발견했습니다. 구체적인 예를 들자면, 952x952 픽셀의 공간 해상도를 갖춘 인간과 유사한 20,000시간(2.3년)의 비디오 데이터로 훈련된 2.5B 매개변수 ViT 모델이 ImageNet에서 대략 인간 수준의 정확도에 도달할 수 있어야 한다고 추정합니다. 따라서 인간 수준의 역량은 실질적인 귀납적 편견 없이 매우 일반적인 학습 알고리즘 및 아키텍처를 사용하여 인간과 유사한 지각 경험(양과 유형 모두에서 인간과 유사)을 통해 근본적인 지각 능력을 달성할 수 있습니다.


헹가래


자동등록방지

추천 비추천

3

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2860 설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [27] 모브갤로그로 이동합니다. 24.01.24 6073 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2867] 특갤용갤로그로 이동합니다. 23.08.06 37315 41
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 1958 2
363220 공지 선형글 삭제 기준 [6] 특갤용갤로그로 이동합니다. 23.10.14 6566 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 12361 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [50] 특갤용갤로그로 이동합니다. 23.11.07 8299 79
385147 공지 구글의 AGI 분류 체계 [16] ㅇㅇ갤로그로 이동합니다. 23.11.22 7505 30
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 8483 29
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 21840 33
470647 일반 요번건 관심없던 사람들한테도 크게 다가오겠네 ㅇㅇ갤로그로 이동합니다. 03:21 0 0
470646 일반 지금 플레이그라운드에서 못쓰는사람들 ㅇㅇ(175.208) 03:21 3 0
470645 일반 LLM <--- 폴더폰 느낌 ㅋㅋㅋㅋㅋㅋ ㅇㅇ(211.222) 03:21 15 0
470644 일반 특이점 같은 소리하지마셈 .. 미안하지만 나미부갤로그로 이동합니다. 03:21 6 0
470643 일반 그래서 취업 어떻게할건데??ㅋㅋㅋㅋㅋㅋ 수퍼고수(110.10) 03:21 14 0
470642 일반 그냥 나만 미국 뭔가 미친듯이 부러워지냐ㅋㅋ ㅇㅇ(121.143) 03:21 6 0
470641 일반 시각 장애인한테 주변 풍경 설명해주는 GPT-4o ㅇㅇ갤로그로 이동합니다. 03:21 9 0
470640 일반 내가 예언 하나 함 ㅇㅇ(221.155) 03:21 30 0
470639 일반 4o 어디서 고를수 있음 ? ㅇㅇ(61.97) 03:21 21 0
470638 일반 근데 지미 애플이 gpt4o 2023년 모델이라지 않았음? 특술람갤로그로 이동합니다. 03:21 33 0
470637 일반 호들갑 친거에 비해.. 흠.. 그정돈가.. [1] ㅇㅇ갤로그로 이동합니다. 03:21 51 1
470636 일반 레커할배 싱글벙글하고있겠노 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(39.124) 03:20 30 0
470635 일반 먼갤임??첨보는데 념화력오지네 [2] 강꿈치갤로그로 이동합니다. 03:20 60 0
470634 일반 일반인들도 요번에는 충격이것네 수직충갤로그로 이동합니다. 03:20 13 0
470633 일반 좀 실망스럽다 했다고 기를 쓰고 달려드는 놈들은 대체 뭐임 [1] 비닌갤로그로 이동합니다. 03:20 41 0
470632 일반 님들 playground에서 gpt-4o 쓰면 돈나감 ㄷㄷㄷㄷㄷ [2] ㅇㅇ(222.235) 03:20 90 0
470631 일반 세상을 바꾸는것은 게이와 여성과 대머리였나 [1] 1229(1.229) 03:20 11 0
470630 일반 AI기술 구글이 1년정도 격차남 [2] ㅇㅇ갤로그로 이동합니다. 03:20 38 0
470629 일반 4 출시 1년만에 LLM시대 종결나버리네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(211.222) 03:20 68 0
470628 일반 근데 한국은 저 기술들수혜 받으려면 한참멀음 탈조선갤로그로 이동합니다. 03:20 72 0
470627 일반 이제 앞으로 아가리털드만이라는 별명은 사라지겠네 ㅇㅇ(58.29) 03:20 12 0
470626 일반 특붕이에겐 아직 부족한게 맞음 ㅇㅇ(222.96) 03:20 10 0
470625 일반 그냥 팔리는 상품을 만든거지 이건 ai가 아닌데.. [8] ㅇㅇ갤로그로 이동합니다. 03:20 121 0
470624 일반 레이턴시 개선이 미친 건데 ㅇㅇ(119.207) 03:20 35 0
470623 일반 나 일본어좀 하는데 회화상대가없어서 회화실력이 안느는데 [2] 시마무라갤로그로 이동합니다. 03:19 63 0
470622 일반 별거 없을거라 예상했어서 오늘 발표 대만족임 [1] ㅇㅇ갤로그로 이동합니다. 03:19 50 0
470621 일반 맞네 ㅋㅋ FigureAI 시연 영상에 나온 모델이 gpt4o인가보다 [4] ㅇㅇ(58.226) 03:19 145 1
470620 일반 이거 4o한테 시키려고 하는데 어캄 초2때부터야동본놈(116.36) 03:19 32 0
470619 일반 샘알트만 좆레발 아니었고 세상이 뒤집어진거 맞음 ㅇㅇ(218.153) 03:19 72 0
470618 일반 Her [2] 퐁칸8갤로그로 이동합니다. 03:19 76 0
470617 일반 현실에 별 영향없는이유.........jpg [4] 수퍼고수(110.10) 03:19 218 3
470616 일반 agi를 목표로 했을때 드라마틱한 차이 없다는건 알겠는데 [1] ㅇㅇ(115.139) 03:19 57 0
470615 일반 예상보다 더 빠른 게 빙냥이ㄱㅇㅇ갤로그로 이동합니다. 03:19 30 0
470614 일반 마법 맞네 ㅇㅇ 거의 램프요정수준 ㅇㅇ(211.222) 03:18 72 0
470613 일반 결국 gpt2 good은 뭐였던 거임 [1] ㅇㅇ(220.83) 03:18 101 0
470612 일반 GPT 성능 벤치마크용으로 좋은 프롬프트 뭐 있냐 [4] rtOS갤로그로 이동합니다. 03:18 60 0
470611 일반 오늘로서 일단 확실해진 것 [2] ㅇㅇ(125.137) 03:18 150 1
470610 일반 왜 NSFW 제한 푼건지 알겠다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [2] ㅇㅇ(58.78) 03:18 209 0
470609 일반 기존 어시스턴트도 말 끊어지는데? ㅇㅇ ㅇㅇ갤로그로 이동합니다. 03:18 69 0
470608 정보 GPT4o playground에서 써볼수 있나본데 [4] ㅇㅇ­갤로그로 이동합니다. 03:18 130 0
470607 일반 특붕이들은 아직 부족한게 맞긴 함 ㅋㅋㅋ [1] ㅇㅇ(222.96) 03:18 56 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2