디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 기존GPT4 파라미터 1760B썰 지오핫이 누설한거네

e/linear갤로그로 이동합니다. 2024.05.19 01:33:18
조회 229 추천 2 댓글 1
														

1ebec223e0dc2bae61abe9e7479f3433cd100477d0a3760d39d15f36e363




지오핫 요즘 뭐하고 사나 아직도 comma.ai 팔아먹고 있나 궁금해서 나무위키 좀 보는데

API만 공개하고 상세한 정보는 외부에 알리지 않아서 정확한 매개변수 개수를 알 수 없는 GPT-4에 대해, 조지 호츠는 2,200억 개의 파라미터를 분야별로 8개의 모델에 나누어 훈련 시키고 게이트를 통해 가중치를 조정하는 MoE(Mixture of Experts)라는 방식의 구조로 1조 개인 척 트릭을 썼다고 주장한다. 그의 말이 사실이라면, GPT-3와 GPT-4의 차이는 파라미터 개수가 아니라 MoE 구조의 유무 차이다. 2020년대에 들어서 트랜스포머의 한계점이 점차 드러나는 상황이라 학계의 관심을 받고 있다.

https://namu.wiki/w/%EC%A1%B0%EC%A7%80%20%ED%98%B8%EC%B8%A0



맞나 싶어 영문 자료도 좀 찾아보니 얘가 젤 첨 발언한 거 맞는듯.



0ba7f700efc32f9e3e9effe543f6127346a8fd15df321f85d4bc623f099230


George: 그래, 그래, 우리는 구축할 수 있어. 그래서 오늘날 가장 큰 훈련 클러스터처럼, 나는 GPT-4가 어떻게 훈련되었는지에 대해 잘 알고 있어. 나는 가중치와 관련된 몇 가지 대략적인 숫자를 알고 있어, 하지만 Lama-


Swyx: 1조 개의 매개변수? [00:43:30]


George: 음, 그래, 그래서 GPT-4는 각 헤드에 2200억 개의 매개변수를 가지고 있고, 그리고 그것은 8방향 MoE야. 그래서 혼합 모델은 아이디어가 고갈되었을 때 사용하는 것이야. 그래서, 알다시피, 그것은 혼합 모델이야. 그들은 같은 모델을 8번 훈련시키고, 그리고 작은 트릭을 사용해. 실제로 그들은 16번의 추론을 하지만, 아니, 그것은 그런 식이 아니야- [00:43:45]



1ebec223e0dc2bae61abe9e7449f3433f5d80ef8d094b3e0e6d3d30365



지오핫이 말한 게 정설인게 웃기네. 쟤 천재해커인데 아무 서버나 아무도 모르게 들락거릴듯.. 진짜 들어갔다 나온거면 겁나 웃긴건데 ㅋㅋㅋ


아는사람한테 들었다고 둘러대는데 얘 말고는 누설한 사람이 아무도 없어 ㅋㅋㅋ

자동등록방지

추천 비추천

2

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
489241 일반 보면 볼수록 히스테릭 부리는 정신병자들 늘긴했음 [3] ㅇㅇ(211.214) 03:09 181 0
489240 일반 근데 결국 얀르쿤이 옳은게 맞네... ㄷㄷ [5] ㅇㅇ(211.179) 03:08 524 2
489239 일반 벤치마크만 보면 agi가 얼마나 가까운지 잘 모르겠음 ㅇㅇ(27.119) 03:03 139 0
489238 일반 gpt4o는 신이다 [4] ㅇㅇ(118.235) 03:02 340 0
489237 일반 챗 지피티 왜 새벽에 답변이 성의 없어지냐? [3] ㅇㅇ(14.38) 02:55 172 0
489236 일반 와 챗gpt 이걸선방하네 [4] ㅇㅇ(106.102) 02:54 350 0
489235 일반 개발자들은 주석을 세심하게 짜고 ai한테 갖다 바친다 ㅇㅇ(125.130) 02:47 133 0
489234 일반 보이스 안나오는건 api구현이 어려워서 그럼 [7] ㅇㅇ갤로그로 이동합니다. 02:37 269 0
489233 일반 여긴 양지화에 대해선 반응이 어떰? [3] ㅇㅇ(122.47) 02:36 192 0
489232 일반 최신 llm ai들이 추론붕괴 현상을 보임 [20] ㅇㅇ(106.101) 02:33 1490 26
489230 일반 레딧 특갤은 여기보다 더 심함 [5] ㅇㅇ(106.101) 02:25 397 1
489228 일반 ai그림을 모작하는것도 욕먹음? 그림갤은 ai언급금지길래 여따물어본다 [21] ㅇㅇ(175.198) 02:19 436 4
489227 일반 GPT4o와 Perplexity를 두달간 동시에 사용한 후기 [3] 자애갤로그로 이동합니다. 02:19 309 3
489226 일반 지금 다 자러갔냐 [5] ㅇㅇ(39.7) 02:17 143 0
489225 일반 gpt 지금 문제 있음? [6] ㅇㅇ(39.7) 02:04 180 0
489224 일반 이전에 죽은사람도 살릴수 있을까 [8] ㅇㅇ(122.47) 01:56 301 0
489223 일반 AI = 게르마늄 = 음이온 = 자기치료 = 디톡스 다이어트 [5] 아벨두두갤로그로 이동합니다. 01:55 131 0
489222 일반 엔비디아 = 테슬라 아벨두두갤로그로 이동합니다. 01:55 79 0
489221 일반 오늘도 노동해방과 특이점을 향한 기도를 올립니다 ㅇㅇ(219.240) 01:47 31 0
489220 일반 Ai 게이머의 문제점. [3] ㅇㅇ(175.192) 01:39 271 0
489219 일반 근데 요즘 특갤보면 유독 시비거는 새끼들이 많긴 함 [2] ㅇㅇ(112.163) 01:38 178 2
489217 정보/ 네이버웹툰 ‘캐릭터챗’ 이달 첫선…“주인공과 생생한 채팅” [6] ㅇㅇ(118.235) 01:32 390 1
489216 일반 복제인간에 마인드업로딩 해서 [3] ㅇㅇ(118.235) 01:31 81 0
489215 일반 요새의 구글은 홍보가 문제일까? [3] ㅇㅇ(175.192) 01:30 136 0
489212 일반 vr은 컨텐츠가 없어서 슬픔 [3] ㅇㅇ(125.130) 01:26 152 0
489211 일반 이게 인류 역사상 가장 흥미로운 해냐? [6] ㅇㅇ갤로그로 이동합니다. 01:22 627 5
489210 일반 스마트폰 발전보다도 속도가 훨씬 느린 거 같은디.. [7] ㅇㅇ(118.235) 01:17 265 0
489209 정보/ 노벨상 연구 공부한 AI 화학자, 4분만에 새 화학실험 방법 내놨다 [15] ㅇㅇ갤로그로 이동합니다. 01:17 681 12
489208 일반 ai 불행편 생각해봄 [4] ㅇㄹㄹ(1.241) 01:17 156 0
489207 일반 일반인 실사용 체감은 보이스 밖에 없음 [1] ㅎㅎ(61.82) 01:14 113 0
489206 일반 현재 상류층이 무너질거라 예언하는 지오핫 [3] ㅇㅇ(211.59) 01:13 469 1
489205 일반 gpt 코딩용으로 사용해본 후기 [1] ㅇㅇ(116.43) 01:12 191 0
489204 일반 이번 해가 엄청 흥미로울 거랬는데 [1] ㅇㅇ(121.128) 01:11 100 0
489203 일반 나노머신 나오면 흑인은 거의 사라지겠네 ㅇㅇ(118.235) 01:08 151 0
489202 일반 진짜 존나 불안한게 [7] ㅇㅇ(117.111) 01:05 285 0
489200 일반 찌라시) 어느 분석쟁이가 올린 예측글 [8] ㅇㅇ갤로그로 이동합니다. 01:01 492 0
489199 일반 세상동전 가입 후기 [2] ㅇㅇ(175.192) 00:59 172 0
489198 일반 현재 기대하는 의료혁명 2가지 [1] ㅇㅇ(112.185) 00:56 125 0
489197 일반 나노머신으로 10대때 모습으로 돌아가기 가능할까? [6] ㅇㅇ(118.235) 00:56 192 0
489196 일반 언젠가 약도 집에서 지어 먹을수 있었음 좋겠다 슈퍼130클럽갤로그로 이동합니다. 00:47 49 0
489195 일반 니들은 영생을 살고 싶은거야? [14] ㅇㅇ(112.185) 00:45 284 0
489194 일반 한글로 대화하는거랑 영어로 대화하는거랑 차이 심해? [4] ㅇㅇ(106.245) 00:39 134 0
489193 일반 인간으로부터 독립한 ai [4] ㅇㅇ갤로그로 이동합니다. 00:35 336 0
489192 일반 현실적으로 기본소+득제 도입국가 [2] ㅇㅇ(1.228) 00:31 217 0
489191 일반 특이점 오기 전까진 모두가 시한부 인생이네 [1] ㅓㅓ(175.125) 00:30 230 1
489190 일반 또또 흔들리네 [1] 이세이미야케갤로그로 이동합니다. 00:29 233 1
489189 일반 레이 커즈와일 예언 벌써 하나 실현 됐자나 ㅇㅇ(112.185) 00:27 192 0
489188 일반 수학은 본질적으로 특이점과 같음 꼬마귀염선충!갤로그로 이동합니다. 00:21 95 0
489187 일반 해외 주소로 세금 안 내고 결제했다. [3] oo(175.212) 00:18 211 0
489186 일반 타오햄은 전부터 순수수학에 SW 활용 많이 하더라 ㅇㅇ(119.202) 00:17 84 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2