디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] 인간 수준의 객체 인식 능력을 달성하는 데 필요한 것은 확장뿐

선갤러(125.191) 2024.04.28 20:27:03
조회 63 추천 3 댓글 0
														

https://arxiv.org/abs/2308.03712


이 논문에서는 현재의 자기 지도 학습 방법이 충분히 확장된다면 인간이 배우는 것과 동일한 유형과 양의 시각적 경험으로 인간 수준의 시각적 개체 인식 기능에 도달할 수 있는지 묻습니다. 이 질문에 대한 이전 연구에서는 데이터 크기의 확장만 고려했습니다. 여기서는 데이터 크기, 모델 크기 및 이미지 해상도의 동시 확장을 고려합니다. 우리는 최대 476x476 픽셀의 이미지 해상도를 갖춘 최대 5,000시간의 인간과 유사한 비디오 데이터(장시간 연속, 대부분 자기 중심적 비디오)로 훈련된 최대 633M 매개변수 크기(ViT-H/14)의 비전 변환기를 사용하여 스케일링 실험을 수행합니다. . 자기 지도 학습 알고리즘인 MAE(Masked Autoencoder)의 효율성 덕분에 적은 학비로 이 확장 실험을 실행할 수 있습니다. 우리는 모델 크기, 데이터 크기 및 이미지 크기의 인간 이하 규모에서 이러한 요소가 동시에 확장되면 인간 수준의 객체 인식 능력에 도달하는 것이 가능하다는 것을 발견했습니다. 구체적인 예를 들자면, 952x952 픽셀의 공간 해상도를 갖춘 인간과 유사한 20,000시간(2.3년)의 비디오 데이터로 훈련된 2.5B 매개변수 ViT 모델이 ImageNet에서 대략 인간 수준의 정확도에 도달할 수 있어야 한다고 추정합니다. 따라서 인간 수준의 역량은 실질적인 귀납적 편견 없이 매우 일반적인 학습 알고리즘 및 아키텍처를 사용하여 인간과 유사한 지각 경험(양과 유형 모두에서 인간과 유사)을 통해 근본적인 지각 능력을 달성할 수 있습니다.



추천 비추천

3

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
17088 일반 자꾸 특슬림들 듯대로 안되고 넘어지는 이유 ㅇㅅㅇ [1] 선갤러(122.36) 05.21 103 1
17087 일반 블랙록 자산운용 단위를 알아보아여 ㅇㅅㅇ [1] 선갤러(122.36) 05.21 83 0
17086 정보글 대규모 언어 모델과 인간의 마음 이론 테스트 [1] ㅇㅇ(125.191) 05.21 69 0
17085 일반 견예인은 근본업잔아여 까도 되여 ㅇㅅㅇ 선갤러(122.36) 05.21 54 1
17084 일반 요한슨 재산을 알라보자 [2] 선갤러(125.131) 05.21 120 3
17083 일반 으따 듣보 여배우 한명때문에 특으점 안오게 생겼당께~~ [2] ㅇㅇ(223.38) 05.21 348 23
17082 정보글 룬붕이 "알트만은 잘못한 게 없다" 선갤러(125.191) 05.21 76 1
17081 일반 그러니까 이게 진지하게 쓴글이라는거지? ㅇㅇ(119.201) 05.21 110 9
17080 일반 선형쭝쭝이는 용서해도 decel은 안되져 ㅇㅅㅇ [2] 선갤러(122.36) 05.21 85 2
17079 일반 스캇 오한슨은 마틴 식칼 데스노트 확정이네 ㅇㅅㅇ 선갤러(122.36) 05.21 68 1
17078 일반 방구석 그짝갤러들 뿔났노 ㅋㅋㅋ [1] ㅇㅇ갤로그로 이동합니다. 05.21 265 13
17077 일반 closedai 뒷배는 애쁠이랑 마소에여 ㅇㅅㅇ [1] 선갤러(122.36) 05.21 61 0
17076 일반 스캇 오한슨 헐리웃 랜덤 창녀가 나대네여 ㅇㅅㅇ [1] 선갤러(122.36) 05.21 94 3
17075 일반 스칼렛 요한슨 듣보는 특이점혜택에서 제외다 [2] ㅇㅇ(223.38) 05.21 115 2
17074 정보글 Octo: 오픈소스 일반 로봇 정책 ㅇㅇ(125.191) 05.21 48 0
17073 일반 스칼렛 요한슨도 지옥 완몰가 확정이네 ㅇㅇ(121.139) 05.21 77 0
17072 일반 미라 무라티 "스칼렛 요한슨처럼 들리도록 설계되지 않았다" [2] ㅇㅇ(125.191) 05.21 107 0
17071 일반 어거왜 안뜨냐? [1] ㅇㅇ(1.241) 05.21 55 1
17070 일반 gta4 출시때도 6개월 멈춰달라도르 잇엇져 ㅇㅅㅇ 선갤러(122.36) 05.21 67 1
17069 정보글 샘알트만 "Sky의 목소리는 스칼렛 요한슨의 것이 아니다" ㅇㅇ(125.191) 05.21 58 1
17068 정보글 "사람들은 쓰라린 교훈이 너무 씁쓸해서 싫어합니다" [2] 특술람갤로그로 이동합니다. 05.21 88 11
17067 정보글 구글 연구원 "쓰라린 교훈의 현대적 해석이 불완전하게 이루어진다" 특술람갤로그로 이동합니다. 05.21 68 2
17066 정보글 Uni-MoE: 전문가 혼합을 통한 통합 멀티모달 LLM 확장 특술람갤로그로 이동합니다. 05.21 47 0
17065 일반 강화학습이 자율에이전트셈?? [1] ㅇㅇ갤로그로 이동합니다. 05.21 47 0
17064 정보글 LLM의 메타인지 능력: 수학적 문제 해결에 대한 탐구 ㅇㅇ(125.191) 05.21 52 0
17063 정보글 MoRA: 매개변수 효율적인 미세 조정을 위한 상위 업데이트 ㅇㅇ(125.191) 05.21 44 0
17062 정보글 젠슨황 "비디오 게임의 모든 NPC가 곧 챗봇이 될 것" [1] ㅇㅇ(125.191) 05.21 92 0
17061 일반 루머) OpenAI는 오랫동안 게임 AI 연구 진행 [2] ㅇㅇ(125.191) 05.21 110 0
17060 정보글 알파폴드3 개발자 "AI 기반 생물학적 이해의 미래는 멀티모달" ㅇㅇ(125.191) 05.21 73 1
17059 정보글 마이클 델 회장, “AI, 인터넷·전기처럼 보편화될 것” ㅇㅇ(125.191) 05.21 58 0
17058 일반 AI, 인간 가치 담을 수 있을까…‘인공지능 100대 인물’을 만나다 [1] ㅇㅇ갤로그로 이동합니다. 05.21 77 0
17057 일반 자율에이전트랑 멀티모달 합칠수있음?? [2] ㅇㅇ갤로그로 이동합니다. 05.21 55 0
17056 일반 챗GPT '스카이' 목소리가 스칼렛 요한슨?…오픈AI "모방 아냐" [2] ㅇㅇ(125.191) 05.21 120 0
17055 일반 그래도 오픈ai [3] 선갤러(121.190) 05.21 128 1
17054 일반 Gpt5는 뭐임 [2] ㅇㅇ갤로그로 이동합니다. 05.21 75 0
17053 정보글 Windows PC에 Recall이라는 사진 메모리 기능이 있을 것 ㅇㅇ(125.191) 05.21 47 1
17052 일반 알파고 만든 28년 동지… ‘AI 결투’가 시작된다 [2] ㅇㅇ갤로그로 이동합니다. 05.21 87 0
17051 일반 "2천년에 한 번 있을 일…극단적 사건 일어났다" ㅇㅇ(125.191) 05.21 92 0
17050 일반 Agi 2024 내놓으라고!!!! [2] ㅇㅇ갤로그로 이동합니다. 05.21 63 1
17049 일반 AI 안전은 사기임 [7] ㅇㅇ(125.191) 05.21 108 0
17048 정보글 마이크로소프트, 생성형 AI 기능 탑재 '코파일럿+PC' 출시 ㅇㅇ(125.191) 05.21 111 0
17047 정보글 Anthropic, claude 3 컴퓨팅 4배에 달하는 학습 모델 훈 선갤러(125.191) 05.21 70 7
17046 정보글 사티아 나델라 "openai는 안전성 최우선' [1] 선갤러(125.191) 05.21 73 2
17045 일반 이런걸 환각이라고하나? [1] 선갤러(24.108) 05.21 57 0
17044 일반 시간이지나도 (61.105) 05.21 71 2
17043 일반 OAI 음성 코덱 레이턴시 엔지니어 구인하는 거 보니 e/linear갤로그로 이동합니다. 05.21 119 2
17042 정보글 환각을 개선하는 메모리 튜닝 [1] ㅇㅇ(125.191) 05.21 83 0
17041 정보글 척수는 뇌와 완전히 독립적으로 학습하고 기억할 수 있습니다. [1] ㅇㅇ(125.191) 05.21 75 0
17040 일반 스타트업들은 AGI 반대에 베팅 중 [2] ㅇㅇ(125.191) 05.20 151 0
17039 일반 Agi 레벨2면 일자리절반이날아가는데 [2] ㅇㅇ갤로그로 이동합니다. 05.20 103 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2