디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] 그로킹에 대한 이야기모바일에서 작성

특술람갤로그로 이동합니다. 2024.04.13 09:14:03
조회 36 추천 0 댓글 0
														

https://www.quantamagazine.org/how-do-machines-grok-data-20240412/

 


그 결과, 연구자들은 이제 네트워크가 데이터를 수집하는 과정을 이해하기 시작했습니다. Nanda는 신경망 내에서 두 가지 다른 알고리즘을 사용하는 암기에서 일반화로의 점진적인 내부 전환의 결과로 그로킹의 명백한 외면적 갑작스러움을 봅니다. 그는 네트워크가 학습을 시작하면 먼저 기억하기 쉬운 알고리즘을 파악한다고 말했습니다. 그러나 알고리즘이 더 간단하더라도 네트워크가 훈련 데이터의 각 인스턴스를 기억해야 하므로 상당한 리소스가 필요합니다. 그러나 기억하는 동안에도 신경망의 일부는 일반적인 솔루션을 구현하는 회로를 형성하기 시작합니다. 두 알고리즘은 훈련 중에 리소스를 두고 경쟁하지만 정규화라는 추가 요소를 사용하여 네트워크를 훈련하면 결국 일반화가 승리합니다.


Liu는 “정규화는 천천히 일반화 솔루션 쪽으로 솔루션을 이동시킵니다.”라고 말했습니다. 이는 모델의 기능적 용량, 즉 모델이 학습할 수 있는 기능의 복잡성을 줄이는 프로세스입니다. 정규화가 모델의 복잡성을 제거함에 따라 덜 복잡한 일반화 알고리즘이 결국 승리합니다. Nanda는 “동일한 [수준의] 성능에 대해 일반화가 더 간단합니다.”라고 말했습니다. 마지막으로 신경망은 암기 알고리즘을 폐기합니다.

따라서 지연된 일반화 능력이 갑자기 나타나는 것처럼 보이지만 내부적으로는 네트워크의 매개 변수가 일반화 알고리즘을 꾸준히 학습하고 있습니다. 네트워크가 일반화 알고리즘을 학습하고 암기 알고리즘을 완전히 제거한 경우에만 문제가 발생합니다. Nanda는 "갑작스러워 보이는 일이 실제로 표면적으로는 점진적일 수 있습니다"라고 말했습니다. 이는 다른 기계 학습 연구 에서도 나타난 문제입니다 .

추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2856 설문 주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는? 운영자 24/04/29 - -
16108 일반 룬붕이어디감 특술람갤로그로 이동합니다. 04.26 45 0
16104 일반 지미애플 6월 [4] 특술람갤로그로 이동합니다. 04.26 114 0
16103 정보글 Ms-dos 오픈소스 [1] 선갤러(223.62) 04.26 55 0
16102 일반 능지호소물이 차세대 모델이건 말건 [4] 병신®갤로그로 이동합니다. 04.26 189 16
16101 일반 . 부패하는유전자!!!갤로그로 이동합니다. 04.26 66 1
16100 일반 Gpt 5 성능이 어느정도일지가 궁금하다 [1] 선갤러(180.182) 04.26 75 0
16099 정보글 saranormous "AI 영상 모델의 GPT-1" [2] 특붕이봇(125.191) 04.26 79 0
16098 정보글 OpenAI SORA 팀 인터뷰 특술람갤로그로 이동합니다. 04.26 67 0
16097 일반 가속하셈 [1] 특술람갤로그로 이동합니다. 04.26 46 0
16096 일반 개인적인 생각이지만 ai는 세계 경제의 재앙이 될거 같음 [2] 선갤러(180.182) 04.26 111 1
16095 정보글 GPT-4 따라잡은 중국의 SenseNova 5.0 ㅇㅇ(125.191) 04.26 47 0
16094 정보글 에릭슈미트 "가능한 빠르게 ai 개발해야" 선갤러(125.191) 04.26 44 0
16093 일반 곧 차세대 모델 발표될 분위기긴 한데 [2] 선갤러(125.191) 04.25 157 1
16092 일반 ai로 5시간만에 책 전체번역 ㅇㅇ(125.191) 04.25 88 0
16091 일반 짐 gpt 4 이거 (61.105) 04.25 75 0
16090 일반 전기차 시장 정체 ㄷㄷㄷㄷㄷ 선갤러(121.190) 04.25 78 0
16089 정보글 OpenVoice V2 소개 ㅇㅇ(125.191) 04.25 88 1
16088 일반 GN⁺: OpenAI CEO "거대 AI 모델 시대는 이미 끝났다" [4] ㅇㅇ갤로그로 이동합니다. 04.25 146 0
16087 일반 it 갈라파국에 살면서 애플 까는애들 웃기네 ㅋ [1] ㅇㅇ(172.226) 04.25 79 3
16086 정보글 점 단위로 생각해보자: 트랜스포머 언어모델의 숨겨진 계산 ㅇㅇ(125.191) 04.25 52 1
16085 일반 작은것말고 큰게와야함!! [2] ㅇㅇ갤로그로 이동합니다. 04.25 70 1
16084 정보글 지미애플 "인간의 특별성 재고" 특붕이봇(125.191) 04.25 70 0
16082 정보글 미드저니 ceo "향후 12개월 3d 실시간" 특술람갤로그로 이동합니다. 04.25 68 1
16081 정보글 룬붕이 모델은 살아있는 외계생물 [2] 특술람갤로그로 이동합니다. 04.25 84 0
16080 정보글 "AI와 공존 넘어 '협업'으로…질문 잘하는 사람이 미래 최종 승자" 특술람갤로그로 이동합니다. 04.25 49 0
16079 정보글 OpenAI Chris Lehane, "AI는 핵심 인프라" 특술람갤로그로 이동합니다. 04.25 39 0
16078 일반 갠적으로는 agi는 한참 멀었는데 기술적 실업은 코앞문제라 생각해서 [5] 선갤러(218.153) 04.25 120 2
16077 일반 알트만 가속 특술람갤로그로 이동합니다. 04.25 83 2
16076 일반 Gemini experimental 특술람갤로그로 이동합니다. 04.25 43 0
16075 일반 특이점 온다해도 ㅇㅇ(1.241) 04.25 60 2
16074 일반 끝이다. ㄷㄷㄷ 선갤러(222.117) 04.25 75 0
16073 일반 선형갤 챗봇 아니라는 건 비합리적인 생각이지 [1] shuwa갤로그로 이동합니다. 04.25 59 1
16072 일반 근데 선형갤러들도 대부분 기술적 실업의 위험성에 대해선 공감함? [8] ㅇㅇ(218.153) 04.25 121 2
16071 일반 지능 만드는 법 [2] NEMO갤로그로 이동합니다. 04.25 55 0
16070 일반 저는 선갤쭝쭝들이 미래에측하는거 우슴만 나와여 ㅇㅅㅇ [1] 선갤러(122.36) 04.25 85 2
16069 일반 agi 오는 시기 에상 ㅇㅅㅇ [2] 선갤러(122.36) 04.25 127 0
16068 정보글 AGI "AI 지능 향상은 무한대" 특붕이봇(125.191) 04.25 93 1
16067 정보글 itsandrewgao "사마 사장의 스탠퍼드 강연" 특붕이봇(125.191) 04.25 57 0
16066 정보글 샘알트만 "scale is all you need" 특술람갤로그로 이동합니다. 04.25 92 2
16065 일반 일본이 한국보다 AI 앞서는듯 [2] 인안나갤로그로 이동합니다. 04.25 109 1
16062 일반 모든 것은 최적화 문제 [1] ㅇㅇ(125.191) 04.25 70 0
16061 정보글 oai 연구원 "데이터셋이 전부" [2] 선갤러(125.191) 04.25 114 3
16060 정보글 OpenAI H200 [2] 선갤러(125.191) 04.25 96 3
16059 일반 진화팁 NEMO갤로그로 이동합니다. 04.25 52 0
16057 일반 Snowflake 482B-MoE 오픈소스 ㅇㅇ(125.191) 04.25 63 0
16056 일반 나 여기 처음인데 [3] ㅇㅇ(211.234) 04.24 276 16
16055 일반 rabbit r1 소스코드 유출 ㅇㅇ(125.191) 04.24 123 0
16052 일반 사실이면 어떡해 [3] 선갤러(158.255) 04.24 60 0
16051 정보글 멀티모달 언어모델은 텍스트-이미지 생성을 위한 인간 정렬 주석자 ㅇㅇ(125.191) 04.24 47 0
16050 일반 지능 만드는법.txt [2] NEMO갤로그로 이동합니다. 04.24 77 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2