디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] gpt2의 정체에 대한 추측 (진지글)

ㅇㅇ(210.223) 2024.05.01 14:34:15
조회 2931 추천 23 댓글 12
														

모두 다 알겠지만 기본 지식부터 짚고 넘어가면 2017년에 그 유명한 'Transformer' 모델이 발표된 이후 LLM에서는 구글의 BERT와 OpenAI의 GPT로 대표되는 두 가지 파생 모델로 나뉘었고 GPT가 너무 압도적인 성능을 보여 너도나도 이쪽을 하고 있음. (Transformer와 정확히 어떻게 다른지는 직접 검색해봐)


그런데 GPT, GPT-2, GPT-3는 모델의 크기와 학습량, 즉 스케일이 커졌을 뿐 모델의 아키텍처 자체는 큰 변화가 없었어. GPT-3.5, GPT-4 는 모델이 공개가 되지 않아서 아무도 모르지만, 아마 더더욱 큰 스케일과 MoE를 적용한 것 이외에는 구조 자체는 비슷할거라고 추측할 수 있음. 제미니, 클로드, 여러가지 오픈소스 모델들이 다들 비슷비슷한 성능을 보여주는 이유도 기본적인 아키텍처 자체는 대단한 차이가 없어서 그럼. 여기서 스케일을 100배, 1000배 계속 늘리기만 한다면 성능이 올라가기는 할 텐데 그에 비례한 만큼의 전기(돈)이 들어가고 데이터를 합성해서 불리는 것도 한계가 있음. 그래서 LLM의 한계가 찾아왔다는 지적들도 지금 꽤 많지. 

여기서 GPT2라는 새로운 네이밍이 나왔다? 이는 Transformer를 기반으로 하지만 GPT의 아키텍처 자체를 '근본적'으로 개선한 새로운 라인업이라고 추측이 가능함. 물론 이에 대해 "그런 좋은 모델이 있다면 GPT-4에 비해 압도적으로 성능이 좋아야 할 것 아니냐!" 라는 반론이 가능함. 

하지만 OpenAI도 아예 신개념의 아키텍쳐를 새로 개발했다면 처음부터 GPT-4 급의 자본을 쏟아부어 큰 모델을 만들지 않고 작은 모델부터 순차적으로 학습시켜 볼 것임. 그러다 마침 GPT-4 혹은 그 이상 급의 학습이 완료된 것이고 객관적인 성능 확인 및 사람들의 관심을 끌기 위해 허깅페이스에 몰래 올려둔 것이라고 생각됨. 공개 전개 호들갑 떨지 않은 것은 아직은 작은 모델이니 대대적으로 광고하면 사람들이 실망할게 뻔하기 때문. 하지만 허깅페이스까지 기어 들어와 모델을 돌려본 사람들이라면 위와 같은 사실을 파악할 거라고 생각했겠지. 


좀 있으면 모델 크기 키워서 GPT2-5..... 같은 구린 네이밍으로 발표하지 않을까 싶음.... 이게 여름에 나온다는 모델일 수도 있고. 


요약: 

1. 단순 경량화 GPT-4 아니고 새로운 기술 도약일 가능성
2. 념글에 올라왔던 이 그림의 '불연속점' 으로 생각됨. 

a17d2cad2f1b782a99595a48fa9f3433f728bd6f6b8abd3c6f5faafbd3


자동등록방지

추천 비추천

23

고정닉 12

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
472439 일반 GPT4O 갓 패치 ㅇㅈ한다 ㅇㅇ(118.235) 05.14 3525 30
472362 정보/ 오픈AI 직원 : 사람들이 GPT-4o에 대해 오해하고 있다 [42] rtOS갤로그로 이동합니다. 05.14 7085 53
471494 정보/ 처음으로 mathvista에서 인간을 능가한 gpt4o [24] 특술람갤로그로 이동합니다. 05.14 4086 32
472057 정보/ OAI 이벤트 초대남이 우연히 들은 말 [10] ㅇㅇ(119.77) 05.14 629 16
472054 일반 "숨죽였던 치타가 달리기 시작한다" [19] ㅇㅇ(118.37) 05.14 4457 36
471541 일반 ■완장들은 특갤계엄령 선포해라 분탕들 좆지랄떠는거 안보이나 [24] ㅇㅇ(61.97) 05.14 2683 44
471512 일반 GPT-4o 실체.jpg (특슬람, 선형충 멸망) [13] ㅇㅇ(218.238) 05.14 7079 32
471475 일반 념글 사과문제 영어로 하니까 맞추는데? [14] ㅇㅇ(119.192) 05.14 4002 29
471384 일반 념글GPT4도 리롤하면 사과문제 못맞추잖아 [7] ㅇㅇ(121.184) 05.14 3157 17
471376 일반 4o에 왜 열광하는지 모르겠음 [61] 비닌갤로그로 이동합니다. 05.14 6551 37
471362 일반 gpt 4o 빠른대신 구리네 [24] ㅇㅇ(175.125) 05.14 6085 25
471328 토의 하도 근들갑 떨어대길래 공식영상 보고 왔는데 [21] ㅇㅇ(103.212) 05.14 3768 31
471293 일반 솔직히 살짝 짜치면 개추... [7] ㅇㅇ(183.98) 05.14 5521 40
471208 일반 gpt4o 이미지 인식 미쳤네 ㅋㅋㅋㅋ [27] 비오는날의개구리갤로그로 이동합니다. 05.14 6119 24
471167 정보/ 개쩌는 오픈AI, GPT-4o 음성 모델 영상 모음 [22] 월코존버갤로그로 이동합니다. 05.14 5301 37
471082 일반 ㄹㅇ TTS, stt 모델 갖다 버렸네 도약이노 [16] ㅇㅇ(220.71) 05.14 4195 21
471058 일반 오늘새벽 광란의 특갤 실전 요약.jpg [10] ㅇㅇ갤로그로 이동합니다. 05.14 4696 39
471035 일반 GPT-5 진행상황 곧 공개? [12] ㅇㅇ(59.5) 05.14 4627 24
470838 일반 이미지 인식능력 돌았다 [9] ㅇㅅㅇ(210.91) 05.14 3838 22
470819 일반 Gpt4o 이미지 인식능력 장난아니네 [7] ㅇㅅㅇ(210.91) 05.14 4145 19
470537 정보/ GPT-4o MMLU 88.7 [9] ㅇㅇ(61.82) 05.14 3196 19
470528 AI창 gpt4o로 만든거 gif로 쪄왔다 ㅋㅋㅋㅋ 싹 다 가속시켜!!! [18] ㅇㅇ(121.162) 05.14 2325 22
470492 일반 GPT-4o는 3시간당 80개 메세지 가능 [20] ㅇㅇ(175.208) 05.14 4515 25
470467 일반 이쯤에서 특갤 민심 테스트 간다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [15] lightvector갤로그로 이동합니다. 05.14 3361 70
470406 정보/ 너희들 마지막에 집중안했노 [5] ㅇㅇ(119.77) 05.14 3037 23
470303 일반 영화 her 새짤 개웃기노 ㅋㅋㅋㅋ [15] ㅇㅇ(222.99) 05.14 5020 41
470283 일반 GPT4 초기랑 비슷하니 뭐니하던거 웃음벨이고 ㅋㅋㅋㅋ [2] ㅇㅇ갤로그로 이동합니다. 05.14 2132 23
470248 일반 얘한테 당장 7000조 줘야하면 개추 [9] ㅇㅇ(121.131) 05.14 3713 67
470244 정보/ gpt4o 추가 예시 [26] 특갤용갤로그로 이동합니다. 05.14 4580 31
469010 정보/ [오피셜] 고화질 also 벤치마크 떴다!!!! [20] lightvector갤로그로 이동합니다. 05.14 3517 29
470025 정보/ 오늘 밝혀진 중요한 정보 [13] ㅇㅇ(119.77) 05.14 3570 27
470148 정보/ 속보))알트만의 gpt-4o 모델 설명!!!!!!!! [10] lightvector갤로그로 이동합니다. 05.14 4146 31
470217 일반 알트만 : her [23] ㅇㅇ(59.5) 05.14 2961 28
470153 일반 gpt-4o api 써봤다 속도 뭐냐..................?? [29] ㅇㅇ(49.143) 05.14 4227 26
470139 일반 한국어 토큰 1.7배 감소 [3] ㅇㅇ(125.250) 05.14 2846 23
469815 정보/ 오늘 새벽 OpenAI 발표 총요약본...txt [26] lightvector갤로그로 이동합니다. 05.14 7420 60
469797 일반 시발년들아 개추 안박고 뭐하냐 [8] ㅇㅇ(58.29) 05.14 2249 56
467482 일반 와 진짜 뭐가오길래 공홈에다 이따구로 근들갑떨어놓은거임? ㅋㅋ [29] ㅇㅇ(124.111) 05.13 4837 40
467404 일반 오늘 자러간 꿀잠충, 출근충, 선형충이 보게 될 상황...JPG [13] ㅇㅇ(175.125) 05.13 3490 33
467355 일반 와 시발 also 진짜 말도 안 되네 [14] ㅇㅇ(210.106) 05.13 4059 22
467137 일반 ??? : 지는 거예요...? [5] ㅇㅇ(218.156) 05.13 2997 28
467129 일반 특갤 개씹뒤집어지는 시나리오... [20] ㅇㅇ갤로그로 이동합니다. 05.13 4092 43
467036 일반 also랑 gpt-4 초기랑 비슷하다 이 지랄하네 ㅋㅋ [31] ㅇㅇ(106.247) 05.13 3409 30
466881 일반 딱 봐도 이거 확정이네 [37] ㅇㅇ(220.71) 05.13 5386 33
466436 일반 고민하는 ai는 진짜 대박인데? [59] ㅇㅇ(117.20) 05.12 6230 31
466269 정보/ 챗지피티에 GPT4.5 업데이트 암시 [15] ㅇㅇ(121.124) 05.12 4959 27
466105 일반 흥분하는 openai 연구원 [42] ㅇㅇ(125.191) 05.12 5727 22
466096 일반 모레 새벽 특갤 예상 [20] ㅇㅇ(211.197) 05.12 3977 40
466090 AI창 gpt2로 DOOM 만들기 [58] ㅇㅇ갤로그로 이동합니다. 05.12 7214 81
465944 일반 "내부적으로 달성된 agi는 없어ㅎㅎ" [36] ㅇㅇ(114.202) 05.11 4564 42
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2