디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] gpt2의 정체에 대한 추측 (진지글)

ㅇㅇ(210.223) 2024.05.01 14:34:15
조회 2925 추천 23 댓글 12
														

모두 다 알겠지만 기본 지식부터 짚고 넘어가면 2017년에 그 유명한 'Transformer' 모델이 발표된 이후 LLM에서는 구글의 BERT와 OpenAI의 GPT로 대표되는 두 가지 파생 모델로 나뉘었고 GPT가 너무 압도적인 성능을 보여 너도나도 이쪽을 하고 있음. (Transformer와 정확히 어떻게 다른지는 직접 검색해봐)


그런데 GPT, GPT-2, GPT-3는 모델의 크기와 학습량, 즉 스케일이 커졌을 뿐 모델의 아키텍처 자체는 큰 변화가 없었어. GPT-3.5, GPT-4 는 모델이 공개가 되지 않아서 아무도 모르지만, 아마 더더욱 큰 스케일과 MoE를 적용한 것 이외에는 구조 자체는 비슷할거라고 추측할 수 있음. 제미니, 클로드, 여러가지 오픈소스 모델들이 다들 비슷비슷한 성능을 보여주는 이유도 기본적인 아키텍처 자체는 대단한 차이가 없어서 그럼. 여기서 스케일을 100배, 1000배 계속 늘리기만 한다면 성능이 올라가기는 할 텐데 그에 비례한 만큼의 전기(돈)이 들어가고 데이터를 합성해서 불리는 것도 한계가 있음. 그래서 LLM의 한계가 찾아왔다는 지적들도 지금 꽤 많지. 

여기서 GPT2라는 새로운 네이밍이 나왔다? 이는 Transformer를 기반으로 하지만 GPT의 아키텍처 자체를 '근본적'으로 개선한 새로운 라인업이라고 추측이 가능함. 물론 이에 대해 "그런 좋은 모델이 있다면 GPT-4에 비해 압도적으로 성능이 좋아야 할 것 아니냐!" 라는 반론이 가능함. 

하지만 OpenAI도 아예 신개념의 아키텍쳐를 새로 개발했다면 처음부터 GPT-4 급의 자본을 쏟아부어 큰 모델을 만들지 않고 작은 모델부터 순차적으로 학습시켜 볼 것임. 그러다 마침 GPT-4 혹은 그 이상 급의 학습이 완료된 것이고 객관적인 성능 확인 및 사람들의 관심을 끌기 위해 허깅페이스에 몰래 올려둔 것이라고 생각됨. 공개 전개 호들갑 떨지 않은 것은 아직은 작은 모델이니 대대적으로 광고하면 사람들이 실망할게 뻔하기 때문. 하지만 허깅페이스까지 기어 들어와 모델을 돌려본 사람들이라면 위와 같은 사실을 파악할 거라고 생각했겠지. 


좀 있으면 모델 크기 키워서 GPT2-5..... 같은 구린 네이밍으로 발표하지 않을까 싶음.... 이게 여름에 나온다는 모델일 수도 있고. 


요약: 

1. 단순 경량화 GPT-4 아니고 새로운 기술 도약일 가능성
2. 념글에 올라왔던 이 그림의 '불연속점' 으로 생각됨. 

a17d2cad2f1b782a99595a48fa9f3433f728bd6f6b8abd3c6f5faafbd3


자동등록방지

추천 비추천

23

고정닉 12

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
476174 정보/ 알파모델 ADA V2 코딩 특화 미쳤다네 [24] 초존도초갤로그로 이동합니다. 05.17 3247 24
476164 정보/ 최신 AI 연구의 큰 두가지 흐름 정리 [56] 나일론마스크갤로그로 이동합니다. 05.17 4655 33
476078 일반 GPT-4o 로 태양계 구현한 게시물을 나도 GPT-4o 웹으로 구현해봄 [7] 특스타갤로그로 이동합니다. 05.16 2410 32
475956 정보/ OAI 스프링 업데이트, 프론티어 모델 예고 ppt [23] ㅇㅇ(119.77) 05.16 3974 36
475750 일반 전독시 AI로 게임처럼 하니까 ㅈㄴ 재밌노 ㅋㅋㅋ [23] ㅇㅇ갤로그로 이동합니다. 05.16 4206 38
475735 AI창 거의 다 그린 그림 AI가 마지막 보정만 살짝 해줌 [48] ㅇㅇ(211.109) 05.16 6408 51
475603 일반 gpt4o 현재까지 공개된 벤치로 제미니, 클로드, 4t와 비교 [8] ㅇㅇ갤로그로 이동합니다. 05.16 3745 25
475377 정보/ 잠잘때 뇌 노폐물 청소? “딱히 그렇지 않아” [48] ㅇㅇ(182.230) 05.15 5704 27
475470 정보/ OpenAI 공동창립자 겸 과학자 "내 직업 대체? 5년정도 걸릴듯" [26] ㅇㅇ(59.17) 05.16 4587 28
475551 정보/ 돼지 뇌, 몸에서 분리된 채 5시간 동안 생존 [33] ㅇㅇ(182.230) 05.16 4703 35
475219 일반 챗GPT-4o 미친것같다 진심;;; [17] 불곰적위대갤로그로 이동합니다. 05.15 7846 44
475180 일반 gpt-4o 이년 진짜 미쳤네 [45] 도서관킬러갤로그로 이동합니다. 05.15 4243 26
475173 일반 GPT-4ㅇ한테 태양계 공전 시스템 코딩시켜봄 [47] ㅇㅇ(221.155) 05.15 5491 41
475023 일반 gpt4o으로 10분만에 만든 하노이탑 시뮬레이션 [14] et갤로그로 이동합니다. 05.15 4225 33
475017 일반 일리야와 초정렬팀이 근본인 이유...factos [15] ㅇㅇ(118.37) 05.15 3615 39
474896 일반 지금 특갤 상황보니까 완장들은 운영 이렇게해야할거같음 ㅇㅇ [25] ㅇㅇ(61.97) 05.15 2826 42
474882 일반 gpt-4o 개오져서 갤순위 높아지니까 유입 분탕충새끼들 개지랄을 하네 [9] ㅇㅇ(125.137) 05.15 2745 44
474775 일반 현재 특이점 갤러리 상황 요약.....jpg [15] ㅇㅇ(59.9) 05.15 5367 34
474562 일반 gpt4o 이거 코드 천줄 넘어가도 잘 인식 하는데 머임? [10] lightvector갤로그로 이동합니다. 05.15 4013 41
474343 일반 속보) 일리야 큰거온다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [8] ㅇㅇ(118.37) 05.15 5281 30
474294 일반 안전, 초정렬, 일리야 내치고도 점진적 발전 ㅇㅈㄹ ㅋㅋ [5] ㅇㅇ(115.22) 05.15 3471 37
474251 일반 Sam Altman 오늘자 인터뷰 요약 [42] ㅇㅇ(58.123) 05.15 5475 59
474088 정보/ 일리야, OAI와 결별 및 프로젝트 공개 예고 [12] ㅇㅇ(119.77) 05.15 3910 38
473930 일반 ??? : 흠.... [22] ㅇㅇ(211.200) 05.15 4544 50
473681 일반 내가 느낀 openai와의 차이점 [24] ㅇㅇ(116.123) 05.15 4387 32
473461 일반 여기서 GPT-4o 메디컬 개 미친 성능 [18] Spark갤로그로 이동합니다. 05.15 5203 39
472895 일반 gpt4o이새끼 좀 지리는데 [6] ㅇㅇ(121.151) 05.15 2062 24
472667 일반 GPT-4o vs GPT-4 풍경 이미지 인식 비교 [18] elryiop갤로그로 이동합니다. 05.14 5402 37
472656 일반 gpt4o는 상상력도 풍부하네 [16] 친근한게이브갤로그로 이동합니다. 05.14 4736 43
472472 일반 진짜 나만 다른 세상인건가 4o 코딩성능 ㅈ되는거같은데 [11] ㅇㅇ(175.213) 05.14 5197 32
472439 일반 GPT4O 갓 패치 ㅇㅈ한다 ㅇㅇ(118.235) 05.14 3479 30
472362 정보/ 오픈AI 직원 : 사람들이 GPT-4o에 대해 오해하고 있다 [43] rtOS갤로그로 이동합니다. 05.14 7014 53
471494 정보/ 처음으로 mathvista에서 인간을 능가한 gpt4o [24] 특술람갤로그로 이동합니다. 05.14 4052 32
472054 일반 "숨죽였던 치타가 달리기 시작한다" [19] ㅇㅇ(118.37) 05.14 4413 36
471541 일반 ■완장들은 특갤계엄령 선포해라 분탕들 좆지랄떠는거 안보이나 [24] ㅇㅇ(61.97) 05.14 2673 44
471512 일반 GPT-4o 실체.jpg (특슬람, 선형충 멸망) [13] ㅇㅇ(218.238) 05.14 7009 32
471475 일반 념글 사과문제 영어로 하니까 맞추는데? [14] ㅇㅇ(119.192) 05.14 3978 29
471384 일반 념글GPT4도 리롤하면 사과문제 못맞추잖아 [7] ㅇㅇ(121.184) 05.14 3133 17
471376 일반 4o에 왜 열광하는지 모르겠음 [61] 비닌갤로그로 이동합니다. 05.14 6480 37
471362 일반 gpt 4o 빠른대신 구리네 [24] ㅇㅇ(175.125) 05.14 5983 25
471328 토의 하도 근들갑 떨어대길래 공식영상 보고 왔는데 [21] ㅇㅇ(103.212) 05.14 3740 31
471293 일반 솔직히 살짝 짜치면 개추... [8] ㅇㅇ(183.98) 05.14 5486 40
471208 일반 gpt4o 이미지 인식 미쳤네 ㅋㅋㅋㅋ [27] 비오는날의개구리갤로그로 이동합니다. 05.14 6035 24
471167 정보/ 개쩌는 오픈AI, GPT-4o 음성 모델 영상 모음 [22] 월코존버갤로그로 이동합니다. 05.14 5257 37
471082 일반 ㄹㅇ TTS, stt 모델 갖다 버렸네 도약이노 [16] ㅇㅇ(220.71) 05.14 4161 21
471058 일반 오늘새벽 광란의 특갤 실전 요약.jpg [10] ㅇㅇ갤로그로 이동합니다. 05.14 4663 39
471035 일반 GPT-5 진행상황 곧 공개? [12] ㅇㅇ(59.5) 05.14 4589 24
470838 일반 이미지 인식능력 돌았다 [9] ㅇㅅㅇ(210.91) 05.14 3811 22
470819 일반 Gpt4o 이미지 인식능력 장난아니네 [7] ㅇㅅㅇ(210.91) 05.14 4108 19
470537 정보/ GPT-4o MMLU 88.7 [9] ㅇㅇ(61.82) 05.14 3185 19
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2