디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] 그로킹에 대한 이야기모바일에서 작성

특술람갤로그로 이동합니다. 2024.04.13 09:14:03
조회 38 추천 0 댓글 0
														

https://www.quantamagazine.org/how-do-machines-grok-data-20240412/

 


그 결과, 연구자들은 이제 네트워크가 데이터를 수집하는 과정을 이해하기 시작했습니다. Nanda는 신경망 내에서 두 가지 다른 알고리즘을 사용하는 암기에서 일반화로의 점진적인 내부 전환의 결과로 그로킹의 명백한 외면적 갑작스러움을 봅니다. 그는 네트워크가 학습을 시작하면 먼저 기억하기 쉬운 알고리즘을 파악한다고 말했습니다. 그러나 알고리즘이 더 간단하더라도 네트워크가 훈련 데이터의 각 인스턴스를 기억해야 하므로 상당한 리소스가 필요합니다. 그러나 기억하는 동안에도 신경망의 일부는 일반적인 솔루션을 구현하는 회로를 형성하기 시작합니다. 두 알고리즘은 훈련 중에 리소스를 두고 경쟁하지만 정규화라는 추가 요소를 사용하여 네트워크를 훈련하면 결국 일반화가 승리합니다.


Liu는 “정규화는 천천히 일반화 솔루션 쪽으로 솔루션을 이동시킵니다.”라고 말했습니다. 이는 모델의 기능적 용량, 즉 모델이 학습할 수 있는 기능의 복잡성을 줄이는 프로세스입니다. 정규화가 모델의 복잡성을 제거함에 따라 덜 복잡한 일반화 알고리즘이 결국 승리합니다. Nanda는 “동일한 [수준의] 성능에 대해 일반화가 더 간단합니다.”라고 말했습니다. 마지막으로 신경망은 암기 알고리즘을 폐기합니다.

따라서 지연된 일반화 능력이 갑자기 나타나는 것처럼 보이지만 내부적으로는 네트워크의 매개 변수가 일반화 알고리즘을 꾸준히 학습하고 있습니다. 네트워크가 일반화 알고리즘을 학습하고 암기 알고리즘을 완전히 제거한 경우에만 문제가 발생합니다. Nanda는 "갑작스러워 보이는 일이 실제로 표면적으로는 점진적일 수 있습니다"라고 말했습니다. 이는 다른 기계 학습 연구 에서도 나타난 문제입니다 .

추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
17148 일반 모하나묻자 얀르쿤이 [1] (61.105) 19:04 5 0
17147 일반 눈물이 나온다 [2] ㅇㅇ(222.96) 17:32 53 1
17146 일반 Scale is all you need [5] 선갤러(125.191) 16:38 84 3
17145 일반 특으점 같은 헛된 꿈을 꾸면 인생 망한다. [1] 병신®갤로그로 이동합니다. 16:31 49 4
17144 일반 진화로 역전파 대체제 만든뒤 상황예측 학습하면됨 NEMO갤로그로 이동합니다. 16:19 10 0
17143 일반 진화로 역전파대체 알고리즘만들어서 상황예측 학습시키면됨.. [1] NEMO갤로그로 이동합니다. 16:18 28 0
17142 일반 스칼렛 요한슨 재산이 2천억밖에 안됨? ㅇㅇ(180.66) 16:00 34 0
17141 일반 저출산을 통해 부의 재분배가 이루어지고 있음 [4] shuwa갤로그로 이동합니다. 15:50 36 0
17140 일반 i support the current thing ㅇㅅㅇ 선갤러(122.36) 15:48 21 0
17139 일반 트위터 글 그만 퍼 오면 안 되냐? 인안나갤로그로 이동합니다. 15:35 36 0
17138 정보글 월드 모델링을 위한 확산: Atari에서는 시각적 세부 사항이 중요합니다 ㅇㅇ(125.191) 14:20 29 0
17137 일반 AI 연구원 스칼렛 요한슨 비판 ㅇㅇ(125.191) 13:13 68 5
17136 일반 큰거 오네 ㄷㄷ 선갤러(182.209) 12:53 68 2
17135 일반 여기 와서 활동하는 특슬람 병신들아 [3] ㅇㅇ(119.201) 12:27 84 4
17134 정보글 AI 석학 앤드류 응 "AI 안전성 추구하되 기술과 응용품 분리해야" ㅇㅇ(125.191) 12:06 35 0
17133 일반 선갤 정신병 목록 shuwa nemo 125.191 [5] ㅇㅇ(119.201) 11:55 72 3
17132 일반 헬조선을 경험한 외국 특붕이 ㅇㅇ(125.191) 11:49 45 0
17131 일반 완전자동으로 지능만드는 법 [2] NEMO갤로그로 이동합니다. 11:38 40 0
17130 정보글 브라이언 존슨 "2030년대가 되면 2020년대가 1800년대 느낌" [4] ㅇㅇ(125.191) 11:09 78 2
17129 일반 완전자동진화 로 의견 굳혔다 NEMO갤로그로 이동합니다. 11:04 25 0
17127 일반 AI 안전 정상 회의는 정치적 쇼에 불과함 ㅇㅇ(125.191) 10:43 49 0
17126 일반 아오 마소 애쁠도 스캠이다 ai 곧 망한다 ㅇㅅㅇ [1] 선갤러(122.36) 10:16 70 1
17125 정보글 일론머스크 뉴럴링크와 AI 시너지로 신체 능력 극대화 할 수있다 ㅇㅇ(222.234) 10:16 60 2
17124 정보글 Meta 400b 모델 가중치 공개하지 않을 계획 ㅇㅇ(125.191) 10:07 23 0
17123 정보글 앤트로픽 직원 openai에 합류 ㅇㅇ(125.191) 10:07 35 0
17122 일반 여기 더있다간 나도 조현병걸릴것같다.. [1] ㅇㅇ(211.234) 09:33 88 7
17121 일반 완전노동대체 노동해방이 불가능한 이유 [2] 선갤러(106.101) 08:26 69 1
17119 일반 스캇 머시기가 타격잇을거라는 쭝쭝이 웃겨여 ㅇㅅㅇ [1] 선갤러(122.36) 06:11 60 0
17118 정보글 MS CTO "기하급수 추세 계속 될 것" [3] 선갤러(125.191) 03:35 96 0
17117 정보글 구글 ai 검색에 광고 넣을 것 선갤러(125.191) 03:34 36 0
17116 정보글 "다음 모델은 고래 크기" 선갤러(125.191) 03:32 86 3
17115 일반 샘알트만 "큰 거 온다" [1] ㅇㅇ(125.191) 03:23 92 0
17114 일반 스칼렛 요한슨 논란 두 줄로 요약함 [3] shuwa갤로그로 이동합니다. 02:50 98 3
17113 일반 스칼렛 요한슨 논란이 이해가 안 됨 [26] shuwa갤로그로 이동합니다. 02:10 118 0
17112 정보글 AI 자동화가 일자리를 완전히 대체하는 대신 지루한 일자리를 제거할 것 [1] ㅇㅇ(125.191) 01:57 44 1
17111 정보글 Microsoft Copilot의 새로운 에이전트 기능으로 가치 창출 ㅇㅇ(125.191) 01:46 37 0
17110 일반 phi-silica가 뭐셈 ㅇㅇ(125.191) 01:10 41 0
17109 정보글 앤트로픽 새로운 해석 가능성 논문 ㅇㅇ(125.191) 00:55 43 0
17108 정보글 Microsoft 나머지 Phi-3 모델 출시 ㅇㅇ(125.191) 00:50 39 0
17107 일반 특이점 2800년쯤에 옵니다 ㅇㅇ(211.234) 00:42 28 2
17106 일반 MS 오늘 빅뉴스 ㅇㅇ(125.191) 00:27 41 0
17105 일반 특이점 알바아님 나디갤로그로 이동합니다. 00:23 42 0
17104 정보글 엔비디아 의료부사장 "생물학에 있어 주요 혁명적인 순간이 지금 진행 중" [2] ㅇㅇ(125.191) 05.21 89 3
17103 일반 MS 윈도우에 추가된 놀랍고 편리한 신기능 [2] shuwa갤로그로 이동합니다. 05.21 79 1
17102 정보글 군사 훈련에 등장한 전투 로봇개 실전배치 눈앞? 위력적인 연속 사격 ㅇㅇ(110.70) 05.21 55 3
17101 일반 GPT-4o기반 에이전트 GAIA 벤치 어떻게 나올까 선갤러(125.191) 05.21 47 0
17099 일반 그냥 특부이들 확신이 없는게 맞음 [5] ㅇㅇ(118.235) 05.21 233 11
17098 정보글 이리나 리쉬의 베팅 [1] 선갤러(125.191) 05.21 80 1
17097 일반 노벨상 수상자 뤽 몽타니에가 말하는 mrna 백신 [1] shuwa갤로그로 이동합니다. 05.21 98 0
17096 일반 이래서는 안된다 공주(216.238) 05.21 50 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2