디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] gpt2의 정체에 대한 추측 (진지글)

ㅇㅇ(210.223) 2024.05.01 14:34:15
조회 2927 추천 23 댓글 12
														

모두 다 알겠지만 기본 지식부터 짚고 넘어가면 2017년에 그 유명한 'Transformer' 모델이 발표된 이후 LLM에서는 구글의 BERT와 OpenAI의 GPT로 대표되는 두 가지 파생 모델로 나뉘었고 GPT가 너무 압도적인 성능을 보여 너도나도 이쪽을 하고 있음. (Transformer와 정확히 어떻게 다른지는 직접 검색해봐)


그런데 GPT, GPT-2, GPT-3는 모델의 크기와 학습량, 즉 스케일이 커졌을 뿐 모델의 아키텍처 자체는 큰 변화가 없었어. GPT-3.5, GPT-4 는 모델이 공개가 되지 않아서 아무도 모르지만, 아마 더더욱 큰 스케일과 MoE를 적용한 것 이외에는 구조 자체는 비슷할거라고 추측할 수 있음. 제미니, 클로드, 여러가지 오픈소스 모델들이 다들 비슷비슷한 성능을 보여주는 이유도 기본적인 아키텍처 자체는 대단한 차이가 없어서 그럼. 여기서 스케일을 100배, 1000배 계속 늘리기만 한다면 성능이 올라가기는 할 텐데 그에 비례한 만큼의 전기(돈)이 들어가고 데이터를 합성해서 불리는 것도 한계가 있음. 그래서 LLM의 한계가 찾아왔다는 지적들도 지금 꽤 많지. 

여기서 GPT2라는 새로운 네이밍이 나왔다? 이는 Transformer를 기반으로 하지만 GPT의 아키텍처 자체를 '근본적'으로 개선한 새로운 라인업이라고 추측이 가능함. 물론 이에 대해 "그런 좋은 모델이 있다면 GPT-4에 비해 압도적으로 성능이 좋아야 할 것 아니냐!" 라는 반론이 가능함. 

하지만 OpenAI도 아예 신개념의 아키텍쳐를 새로 개발했다면 처음부터 GPT-4 급의 자본을 쏟아부어 큰 모델을 만들지 않고 작은 모델부터 순차적으로 학습시켜 볼 것임. 그러다 마침 GPT-4 혹은 그 이상 급의 학습이 완료된 것이고 객관적인 성능 확인 및 사람들의 관심을 끌기 위해 허깅페이스에 몰래 올려둔 것이라고 생각됨. 공개 전개 호들갑 떨지 않은 것은 아직은 작은 모델이니 대대적으로 광고하면 사람들이 실망할게 뻔하기 때문. 하지만 허깅페이스까지 기어 들어와 모델을 돌려본 사람들이라면 위와 같은 사실을 파악할 거라고 생각했겠지. 


좀 있으면 모델 크기 키워서 GPT2-5..... 같은 구린 네이밍으로 발표하지 않을까 싶음.... 이게 여름에 나온다는 모델일 수도 있고. 


요약: 

1. 단순 경량화 GPT-4 아니고 새로운 기술 도약일 가능성
2. 념글에 올라왔던 이 그림의 '불연속점' 으로 생각됨. 

a17d2cad2f1b782a99595a48fa9f3433f728bd6f6b8abd3c6f5faafbd3


자동등록방지

추천 비추천

23

고정닉 12

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
478437 일반 뭐든지 학습시켜버리면 그만아님? [4] ㅇㅇ(125.143) 05.20 132 0
478436 일반 그러게 치킨 배달 자체가 없어지겟구나 [7] 스가돈갤로그로 이동합니다. 05.20 213 0
478435 일반 진지하게 돈이고 커리어고 다 팽개치고 주말알바만 하면서 살고 [4] ㅇㅇ(133.106) 05.20 148 0
478434 일반 2095년에 agi 무조건 나올듯 [4] ㅇㅇ갤로그로 이동합니다. 05.20 194 2
478433 일반 나는 이 우주가 처음이 아니고 우주를 초월한 지적 문명도 존재한다고 믿는 [5] 'kl;'l;'l;'l;l;(121.178) 05.20 184 0
478432 일반 근데 노동해방오면 치킨배달은 누가함 [10] 스가돈갤로그로 이동합니다. 05.20 250 0
478431 일반 노동해방 언제와 나 더이상 참을수가없어 ㅇㅇ(133.106) 05.20 48 1
478430 일반 "몇주" 라는건 1달은 안넘는단 말이겠지? [8] ㅇㅇ갤로그로 이동합니다. 05.20 295 0
478428 일반 원래 api 이리쓰면 비쌈? [6] ㅁㄴㅇ(121.166) 05.20 185 0
478427 일반 근데 항노화/역노화는 특이점안오면 아예 못만드냐? [15] ㅇㅇ갤로그로 이동합니다. 05.20 250 0
478426 일반 ㅌㅇㅈ ㅈㅂ 213ㅇㅊ [5] 포스트휴먼.갤로그로 이동합니다. 05.20 83 1
478425 일반 나도 ai활용해서 잘 놀고싶은데요 [5] 스가돈갤로그로 이동합니다. 05.20 137 0
478424 일반 쿠팡 광고 [1] 제타플롭스갤로그로 이동합니다. 05.20 142 0
478422 일반 근데 섹스봇 무한 공급보단 그냥 중독성 없는 마약이 낫지 않음? [17] ㅇㅇ(203.234) 05.20 303 1
478421 일반 2050년 안에 타임머신 발명된다 [3] hj;jkl;kl;(121.178) 05.20 145 0
478420 일반 휴머노이드 쪼개서 개별 기기 만들면 되지 않냐는 저능아임? [13] ㅇㅇ갤로그로 이동합니다. 05.20 220 4
478419 일반 레이 커즈와일이 생각하는 강인공지능의 기준 [1] ㅇㅇ갤로그로 이동합니다. 05.20 242 0
478418 일반 불과 2차 세계 대전 불과 100년 만에 특이점을 바라본다 [6] rrwerfsd(121.178) 05.20 195 0
478417 일반 LLM이 극한에 다다르더라도 의식이 어디서 오는지 밝혀내지 못한다면 [3] Caiotto갤로그로 이동합니다. 05.20 195 0
478416 일반 이번 세기 내로는 완몰가는 안될 것 같고 vr은 [6] ㅇㅇ(125.134) 05.20 160 2
478415 일반 내년 초까진 얀르쿤 기다려봐라 [4] ㅇㅇ(121.140) 05.20 170 1
478414 일반 2065년 과학의 발전 예측해볼 수 있는사람? [1] ㅇㅇ(59.26) 05.20 136 0
478413 일반 중독성 없는 마약 VS 도파민 수용체 원상복구 [1] ㅇㅇ갤로그로 이동합니다. 05.20 157 0
478412 일반 휴머노이드 만드는건 본능임 ㅇㅇ(182.210) 05.20 51 0
478410 일반 슬슬 주거 문화도 아파트에서 타운하우스로 넘어갈듯 [2] ㅇㅇ(211.184) 05.20 157 0
478409 일반 Oai가 스케일 원툴이라 생각하는 병신들 있더라 [5] ㅇㅇ(58.29) 05.20 435 8
478408 일반 현직 백순데 아직 백수대체하는건 무리라고 본다 [1] ㅇㅇ(125.143) 05.20 165 1
478407 일반 미안하지만, 현.직 종사자인데 자율주행? 아직 이쪽 업계에선 ㅇㅇ갤로그로 이동합니다. 05.20 184 0
478406 일반 LLM은 생각을 하지 않는다. LLM의 출력이 곧 생각이니깐 [7] ㅇㅇ(119.202) 05.20 277 7
478405 일반 이제 자율주행차가 제일 기다려 짐, 인공지능 어느 정도 됐으니까 ㅇㅇ(182.211) 05.20 73 0
478404 일반 특갤에도 휴머노이드에 거부감가지는 애들 많네 [17] xdxd333갤로그로 이동합니다. 05.20 316 2
478403 일반 마소발표 화요일 새벽 아니고 목요일 새벽이었음? [3] ㅇㅇ갤로그로 이동합니다. 05.20 249 0
478402 일반 gpt 4랑 4o랑 지능차이는 별로 없음? [1] ㅇㅇ(121.165) 05.20 186 0
478401 일반 오늘 마소 발표 새벽 몇 시에 시작함? [1] ㅇㅇ갤로그로 이동합니다. 05.20 189 0
478400 일반 요즘 뉴스 보면 호들갑 작살나던데 ㅇㅇ(117.20) 05.20 204 0
478399 일반 근데 휴머노이드 나오면 진짜 엠생들만 좆되는거 아니냐 [7] ㅇㅇ갤로그로 이동합니다. 05.20 291 0
478398 일반 자율주행차 언제 가능함? 2025년? [2] ㅇㅇ(182.211) 05.20 122 0
478397 일반 2029 agi 2045 특이점 근거가 뭐임? [8] 잇군갤로그로 이동합니다. 05.20 251 0
478396 일반 mmlu 90 찍은거 있잖아 ㅇㅇ(112.186) 05.20 138 0
478395 일반 휴머노이드는 가사도우미가 아니다 [1] ㅇㅇ(59.26) 05.20 92 0
478394 일반 휴머노이드 불가능한 이유 ㅇㅇ갤로그로 이동합니다. 05.20 124 0
478393 일반 집안일 매일 할 필요는 없지 [10] ㅇㅇ(118.33) 05.20 254 4
478392 일반 gpt4 처음 나왔을때 mmlu 얼마였음? [2] ㅇㅇ갤로그로 이동합니다. 05.20 137 0
478391 일반 인간관계나 정신병 , 성격 같은 거 상담하거에 추천하는 ai 있냐? ㅇㅇ(220.126) 05.20 50 0
478390 일반 휴머노이드 보니까 육체노동도 조만간이네 ㄷㄷ [3] ㅇㅇ갤로그로 이동합니다. 05.20 192 0
478389 일반 본인이 바라는 삶....list [10] ㅇㅇ(124.57) 05.20 336 3
478388 일반 gpt4-o 체험해보니까 구독하고 싶어지네 뉴비예정(219.251) 05.20 136 0
478387 일반 휴머노이드 한대로 다양한 일 시키는데 전용기계를 다 따로? [10] ㅇㅇ(218.147) 05.20 175 1
478386 일반 ai 전문가랍시고 불러놨더니 개인의 노력 어쩌고 [3] ㅇㅇ(211.184) 05.20 233 4
478385 일반 mmlu 86-88 수준에서 정체된거 같은 기분임 [4] ㅇㅇ(110.145) 05.20 215 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2