디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[🏆베스트] 뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250308)

ㅇㅇ갤로그로 이동합니다. 2024.11.23 18:20:35
조회 31303 추천 42 댓글 0
														


최근 업데이트

2025-03-08 KST

3dafd92be09c28a8699fe8b115ef046c9dad

최근 김유식이 일부러 그러는건지 작았던 특갤이 하루에도 몇번씩 실베에 가서 유입들이 많이 보이기 시작했다.

기존 공지글은 너무 전문적인 정보글로 채워져 있어서 유입 뉴비들의 시각에서 글을 한번 써봤다.


본 글도 주기적으로 업데이트 하고 있지만, AI업계 특성상 너무 발전속도가 빨라 몇 달만 지나도 아래 있는 내용이 지금 당장의 상황을 반영하지 못하고 구식 모델을 설명할 수도 있다. 미안하다는 말을 전하며, 최대한 빨리 AI업계 트렌드에 맞추어 업데이트 하도록 하겠다.


기존에 논문으로 구성된 정보 공지글을 보고 싶다면 여기로



--


1. 특이점이 뭔가요?

: '특이점'은 미래학자 '레이 커즈와일' (갤주라 하면 보통 이 사람을 말함)이 작성한 2005년 도서 '특이점이 온다' 도서에서 발췌한 용어다.

본 마이너 갤러리는 기술적 특이점(인공지능의 발전이 가속화되어 모든 인류의 지성을 합친 것보다 더 뛰어난 초인공지능이 출현하는 시점)에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하고 있다.


2. 인터넷 보니까 GPT? llm? 뭐 그러던데 그게 뭔가요?

: LLM은 Large Language Model 이라는 단어의 약자로, GPT와 같은 채팅 봇을 구동해 주는 근본 모델이자 기술로 이해하면 된다. GPT는 대일밴드처럼, ChatGPT가 너무 유명해서 LLM=GPT와 같이 보통명사화 되었다고 생각하면 된다.

LLM 기술은 2017년에 구글에서 발표한 'Attention is All You Need' (일명 트랜스포머 논문) 이후, 현 시점까지 그리고 앞으로의 우리를 특이점에 데려다 줄 기술로 평가되고 있다. 이 논문을 요약하면 '어라? 좋은 성능의 그래픽카드를 병렬로 연결해서 연산을 시키니까 갑자기 프로그램이 사람처럼 추론능력이 생기고, 심지어 그 성능이 올라가네? 근데 그 이유를 모르겠어!' 정도가 되겠다.


이 LLM 기술을 바탕으로 서비스 하는 기업(모델)은 ChatGPT, Claude, Llama(오픈소스), Gemini... 등이 있고,

무료로도 사용이 가능하지만 성능이 낮은 모델만을 쓸 수 있고, 제한이 아주 빡빡하게 걸려 있으니 매달 20달러를 주고 Plus 플랜으로 사용하는 것이 대부분이다.

'그깟 20달러에 얼마나 성능이 많이 차이나겠어?' 할 수 있지만, 초등학생과 석사/박사로 수준차이를 표현해도 모자랄 만큼 큰 차이가 난다. 무료 모델을 사용하고 실망하지 말고, 이쪽 분야에 관심이 있다면 꼭 결제해서 사용해 보자.


각각의 모델마다 지능 차이, 문체 차이 등이 있으나 뉴비라면 그냥 ChatGPT를 쓰면 된다.


ChatGPT 내에서도 여러 모델이 있는데, 범용으로 사용할 때는 GPT-4o(범용성/작문능력 특화, 3시간에 80회 제한) 내지 o3-mini(수학/과학/코딩분야 특화, 24시간에 150회 제한)를 쓰고, GPT-4.5(범용성/인간다움 특화, 1주일에 50회 제한) 

똑똑한 추론 능력이 필요한 경우에는 o1(1주일에 50회 제한) 내지 o3-mini-high(1일에 50회 제한)을 쓰자.


이 외에도 여러 모델들이 목록에 있지만 쳐다 볼 필요도 없다. 몇달 전의 최고 성능을 가진 모델들을 남겨둔 것인데, 성능도 떨어지고/속도도 느리고/(api 사용 시) 가격도 많이 비싸다.


사용량은 각 메시지를 보낸 시점을 기준으로 계산한다. 예를 들어, 4o 모델에서 14시에 메시지를 하나 보냈다면 17시에 1개 사용량이 회복되는 식이다. 길이에 상관없이 사용자가 메시지를 보낼 때마다 사용량이 올라가니까, 처음 사용해서 이것저것 채팅할 게 많은 특갤러라면 메시지를 한 번 보낼 때마다 많은 걸 물어보도록 하자.

경험상 4o모델과 o3-mini 모델은 카톡처럼 막 써도 문제가 없었지만, o1 모델과 o3-mini-high 모델은 높은 지능만큼이나 사용량 제한이 빡빡하니 주의하자.

(* 원래 o3 모델이 o2 이름을 가질 예정이었으나, o2라는 이름의 브랜드가 이미 등록되어 있어 법정 싸움을 피하고자 o1모델 다음으로 o3 이름을 짓고 출시하였다.)



이 외에도 200달러를 주고 사용해야 하는 Pro 플랜이 있다. 이 플랜을 결제하면 o1 모델의 강화 버전인 o1-pro를 24시간에 100개, 그리고 기타 모든 모델들을 무제한으로 사용할 수 있고 수십분간 인터넷을 돌아다니며 관련 정보를 모아 추론을 한 뒤, 수준급의 글/논문을 제작해주는 'Deep Research' 기능을 1주일에 120회(Plus 플랜은 1주일에 10회) 사용할 수 있으나, 

‘개인이 사용하면서 200달러 뽕을 뽑을 수 있냐?’라는 말에는 솔직히 아니라고 생각한다.


모든 방면에서 성능 하나만큼은 타의 추종을 불허하는 최고라는 느낌이 들지만, 개인이 이 성능을 활용하기에는 한계가 있기 때문이다. OAI에서 직접 언급하지는 않았지만, 내가 느끼기에도 그렇고 X의 체험담도 그렇고, 연구소나 기업의 석박사들을 타겟으로 한 모델이라고 생각한다.

만약 모델의 추가 사용량이 필요하다면, 차라리 계정을 더 만들어서 Plus 플랜을 추가 구독하자.



모바일 앱 같은 경우, 이상한 중국발 스캠 업체에서 광고를 통해 짭을 최상단에 올려 둔 경우가 잦으니, 괜히 20달러 날리지 말고 다운로드하려는 앱의 이름을 잘 확인하자.


간혹 무료로 GPT를 사용하게 해주겠다면서 꼬드기는 이상한 앱이 있는데, 이런 앱들은 100% 당신의 채팅 로그를 수집해서 수많은 빅테크와 중국 기업에 파는 것이 목적이다. 실제로 이게 돈이 꽤 된다고 알려져 있다.

채팅을 하다 보면 온갖 사적인 질문과 개인정보가 오고 갈 텐데, 이름도 얼굴도 모르는 제3자가 당신의 채팅 로그를 보고 낄낄대길 원하지 않으면, 공식 GPT 앱을 받자.



3. AGI? ASI? 초지능? 이게 뭔가요? 그리고 이걸 왜 바라나요?

: AGI는 Artificial General Intelligence, 즉 인공일반지능 / ASI는 Artificial Super intelligence 超지능을 의미한다.

현재 AGI/ASI 개발에서 최선두를 달리고 있는 OpenAI 회사의 기준에 따르면,

AGI는 GPT와 같은 LLM 모델이 '모든 방면에서 인간 수준의 문제 해결 능력과 추론능력을 갖춘 AI' 를 의미한다.

ASI 는 '모든 방면에서 인간을 초월한 문제 해결 능력과 추론능력을 갖춘 AI' 를 의미한다.


ASI 개발에서 가장 중요한 것은 '재귀개선'으로, 즉 인공지능이 스스로를 발전시키는 것이다.

이 부분은 학자마다도, 개발진마다도 의견 차이가 많지만 주류 의견은 'AGI가 스스로를 재귀개선하면, 그것이 인류는 절대 이 속도를 따라갈 수 없다' 는 것이다.

여기서 '인공지능에 인류를 행복하게 하라는 목표를 줬더니, 모든 인류를 잠재우고 뇌에 쾌락 전기자극을 주는게 최선이라고 판단하면 어쩔건데?' 와 같은 의문에서 시작한 인공지능 정렬, 인공지능 안전에 대한 개념이 등장하지만, 여기는 뉴비 가이드니까 다루지 않겠다. 눈팅 몇번 하면 이해할 수 있을 것이다.


특갤러들이 AGI/ASI를 바라는 이유는 결론적으로 행복이라고 생각한다.

지난 수백만년간 인류의 가장 큰 문제였던 먹고 살기 위한 강제적인 노동에서 해방되어, 병들고 아프고 슬픈 사람 없이, 80억 각각이 추구하는 진정한 행복한 삶을 살아가기 위해 과학 기술의 진일보를 기대하는 것이다.


이를 궁극적인 형태로 실현하기 위한 기술로는 완전 몰입형 가상현실(이 기술에 관심이 있다면 꼭 확인해보자. 고대 특갤의 글 중에서도 굉장히 잘 쓰였다고 평가받고 있다.) 이 있다. 다만, 이를 실현하기 위해서는 인간 뇌와 정신에 대한 완벽한 이해가 전제되어야 하기에 현 시점 (2025년 초)에서는 그야말로 공상과학인 영역이다.

본 갤러리에서는 이 기술에 관한 과학적/사회적 논의는 가능하지만, 완전 몰입형 가상현실에서 무엇을 하겠다~ 와 같은 망상적 내용 작성은 제한하고 있다. 완전 몰입형 가상현실 마이너 갤러리로 가서 작성하자.


생각해 보자. 선진국인 한국은 물론이고, 다른 선진국을 보더라도 20년을 공부하고, 40년을 노동하고, 20년을 골골대면서 죽을 날만 기다리는것이 기본에, 병이라도 걸리면 스스로는 물론 주변인까지 고통을 받는다. 너무 불행하지 않는가? 후진국이나 개도국에서 태어났으면 말할 필요도 없다. 이것이 인류의 진정한 행복이라고 말할 수 있을까?


이와 관련하여, OpenAI의 CEO (ChatGPT 개발사) 샘 알트만은 미래의 노동 형태는 지금 당장을 먹고 살기 위해 원하지 않음에도 불구하고 반강제적으로 하는 노동이 아닌, 진정한 자아 실현을 위해서 자발적인 의사로 원하는 노동을 하는 형태로 변화할 것 이라고 주장하기도 했다.



4. 그럼 AGI랑 ASI 언제 오는데요?

: 학자마다, 연구자마다, 개발진마다 의견 차이가 많은 분야이고 일관된 정의가 없기에 딱 잘라서 말하기는 어렵다.

하지만, AI는 정말 말도 안 되는 빠른 속도로 성장하고 있는 분야라 현직 개발진의 말을 1순위로 듣는 것이 합리적일 것이다. (실제로 현 시점에서 몇달 전에 나온 모델 써보라고 하면 구려서 절대 못 쓴다.)


아래는 AGI 개발 완료 시점인지, 대중에게 공개되는 시점인지 명확히 하지는 않았지만 소개해 보자면 아래와 같다.
현직 개발진(OpenAI, 앤트로픽, 엔비디아, 구글 딥마인드, 메타 등등)의 말로는 수 년 이내 (20년대 후반이 가장 많았음)

학자의 말로는 수 년 이내 ~ 20년 이내 (AI 4대 천왕 학자의 AGI 시기 예측)

레이 커즈와일(갤주)는 2029년

이라고 한다. 특갤에서 AGI 정배라고 하면, 레이 커즈와일의 기준인 2029년을 말한다.


ASI 시기는 현 시점에서 AGI도 도달 못한 상황에서 판단하긴 시기 상조라고 생각하지만,

갤주의 정배는 2045년이다.


시간이 지나며 빅테크 개발진/학자들의 AGI/ASI 의 타임라인이 빨라지고 있는것은 사실이지만, 느긋하게 생각하자.



5. 기본 소득? 노동대체? 과도기 이게 뭔 소리?

: AGI의 무서움은 사람이 아니라 실리콘으로 만들어진 기계라는데 있다.

백만원짜리 연산장치(그래픽카드) 1개를 뚝딱 찍어내면, 이게 수명이 다할때까지

24시간동안 다른 연산장치와 하이브마인드로 연구를 수행하고, 아픈것도 없고, 불만도 없고, 일을 시킬수록 성능이 올라가고(재귀개선), 월급도 필요없고, 일할 공간도 필요없고, 복지도 필요없는 꿈의 장치가 행동을 할 것이다. 만약 이 그래픽카드를 1개가 아니라 100개, 10만개, 1000만개씩 연결해서 연산을 시킨다면?


그야말로 꿈의 기계다. 그렇다면 여기서 인간은 대체 뭘 할수 있을까?

당신이 사장이라면 위의 기계를 놔두고 상위 1% 수준의 신체능력이나 두뇌를 지니지도 않은 인간을 비싼 돈 주고, 불만을 들어주면서, 하루에 8시간만 고용을 할까? 정말 비효율의 극치이다.


여기서 기본 소득과 노동대체에 대한 담론이 시작되는 것이다.
ChatGPT를 개발한 OpenAI의 CEO 샘 알트만은 '인공지능 에이전트를 활용한 조 단위 매출을 올리는 1인 기업이 등장할 것이다' 와 같은 말을 하기도 했다.



6. 선형충이 뭐고 왜 맨날 싸우나요?

: 선형충 - 특갤 내에서 사용되는 용어로, AGI는 수십~수백년 후에 가능하다고 주장하는 선형주의자의 멸칭이다.

우선 특갤에서 직업 조롱이나 비하는 보이면 30일 차단 대상이고, 타 갤에서도 반고닉/고닉이 특갤러 가면 쓴 사람이 직업 조롱하면서 분탕을 친다면 차단해주면 고맙겠고, 또 제보해 주면 30일 차단 처리 하도록 하겠다.


경험상 특갤에서 진짜 선형주의자는 별로 없고 어떻게든 특갤에서 한번 분탕쳐보고자 내뇌망상을 레퍼런스라고 가져오는 케이스가 대부분이었다. 그래서 레퍼런스 없는 비관(레없비)이 30일 차단 대상이기도 하다. 그냥 냅두면 갤러리가 바로 개판나기 때문이다.

그냥 병먹금 하고 신문고에 링크 복사해서 일름보 하자.


과거까지의 특갤에서의 논쟁은 'AGI 가능 여부'에 대한 논쟁이 주를 이루었다.

2024년 9월 o1 모델 발표 전까지는 AGI로 가는 길에서는 추론 능력이 가장 걸림돌이었다. 추론 능력이 부족하면 AGI는 커녕, 백과사전 다 외운 챗봇이 끝인 상황이었다.


그렇게 특갤에서는 매일 추론 능력에 관한 이야기를 하며 겨울을 보내고 있던 중, OpenAI의 o1 모델이 발표되며 문제와 답지를 외웠다고 주장하지도 못하는 2024년도 수능 국어와 수학에서 만점에 가까운 점수를 받는 등 비약적으로 추론 능력이 향상된 모델이 나와버렸다. (이전의 최신 모델이자 24년 5월에 출시된 GPT-4o 수능 국어와 수학을 4등급 받았다.)


이 모델 출시 이후, 'LLM 모델은 개-고양이 지능만도 못하다', 'LLM은 추론을 할 수 없다' 'LLM으로 AGI는 수백년 걸린다' 등의 발언으로 선형주의자들의 아이돌이었던 '얀 르쿤' 교수(컴퓨터계의 노벨상인 튜링상 수상자, 트위터 중독자) 조차 계속 입을 꾹 닫고 있다가,
'LLM은 추론 가능한데 비효율적임', 'AGI는 길어도 5-10년 정도?' 로 선회한 모습을 보였다.

24년 12월에는 현존하는 최고 난이도의 수학 문제들로 이루어진 프론티어매쓰 등의 벤치마크에서 수직적 발전을 보이는 o3 모델이 발표되자, 'o3 모델은 LLM이 아니다' 와 같은 발언을 하기도 했다. (당연히 o3모델은 LLM이다.)


이후 유일한 레퍼런스를 잃어버린 선형주의자들은 AGI 달성에는 수백년이 걸린다는 주장의 골대를 옮기면서 특갤에서 AI 디스토피아론 (위에 언급한 안전과 연관되어 있음), 실생활 체감 안됨 등을 밀고 있다.

특갤의 개념글을 과거부터 보다 보면 선형주의자들의 골대가 계속 변하는 것을 확인할 수 있다.

심심하면 과거부터 오름차순으로 을 읽어보도록 하자. 이를테면, 1년 전만 해도 신모델이 출시될 때 '수능 5등급 넘냐?'가 화젯거리였으나, 현재 출시되는 모델들은 기본으로 만점이냐, 1등급이냐를 깔고 가고 있다.



어쨌든 이런 것들이 특갤에서 맨날 싸움만 하는것 처럼 보이는 이유이다.



7. ai기술에 한계가 있다던데요? 저작권 문제가 많던데요?

: 부분적으로 사실이었다. (과거형)

2024년 중반 까지만 해도, 저작권 문제와 인터넷에 남아있는 학습 데이터 부족은 AI 학습에 있어서 가장 큰 걸림돌으로 여겨졌다.

(* LLM은 크게 학습-추론의 과정을 하는데, 학습은 인터넷의 수많은 문자 데이터를 닥치는 대로 긁어모은 다음 문자들 간의 연관관계/상관관계를 GPU 연산장치를 통해 수 개월동안 파악하고 학습하는 방식으로 이루어진다.)

실제로 '이제 학습할 데이터가 없는데 어떻게 더 발전함?' 과 같은 비관론이 득세하기도 했다.


이 문제들을 해결할 수 있는 방안은 합성 데이터(저작권 문제가 없는 데이터끼리 인위적으로 합성하여 또다른 새로운 데이터를 만들어 냄)가 있었는데, 이게 논문은 많이 나왔지만 실제 LLM 모델들은 인터넷상에 존재하는 데이터 90%, 합성 데이터 10% 이런 식으로 학습된 것이 현실이었기에 진성 특갤러마저도 불안함에 떨고 있던 상황이었다.


그러나 o1 모델이 출시되고 얼마 있지 않아 100% 합성 데이터로 훈련된 4o-canvas과, 85% 가량이 합성 데이터로 훈련된 Grok-3 모델이 출시되고, 또 이것이 큰 성능 향상을 보여줌으로써 데이터 부족과 저작권 침해 논란에 대한 것들도 일단락되었다.

다만, 합성 데이터는 많은 자원이 소모되는 특성상 당분간 빅테크 중심으로 이루어질 수 있기에, 중소 기업들까지 합성 데이터를 만드는 기술이 퍼지려면 조금의 시간이 더 필요할 것이라고 생각된다.



이 외에도, 강화학습 방법론이 2025년 초부터 고개를 들고 있다.

대부분 2016년의 알파고-이세돌 대국을 기억할 것인데, 많은 사람들이 여기까지만 알고 있으나 구글은 이세돌과의 대국이 끝나고 관련 분야로 연구를 지속하였다. 이 과정에서 구글이 발견한 것이 강화학습 방법론이다.


이를 쉽게 설명하자면 '옳은 행동을 했을때 보상을 준다' 를 무한 반복하는 것인데, 강화학습 방법론으로 완전한 백지 상태의 모델을 훈련시킨 결과 단 72시간만에 이세돌과 대국한 알파고 모델에게서 100전 100승하는 결과를 냈고, 40일만에 인류의 모든 바둑기사/기존의 바둑 인공지능을 압승하는 실력을 가지게 되었다. (알파고 제로)


이것이 무려 LLM기술에도 적용되는 것을 발견한 빅테크 연구진들은 연초부터 연구를 하기 시작했고

범지구적으로 큰 영향을 주고, 여러분들도 매체를 통해 한번쯤은 들어본 중국의 DeepSeek 모델이 나오기에 이르렀다.


강화학습으로 훈련된 모델은 수십억-수백억 정도만 사용하였으며/개발 기간도 기존 모델에 비해 현저히 짧았으며/구세대의 GPU를 사용해도 충분하였으며/이미 알파고 제로의 성공 선례가 있다는 점에서 미국의 도널드 트럼프 대통령도 언급하는 등 난리가 났었다.


이런 강화학습을 정리한 특갤의 글을 꼭 읽어보자.


빌 게이츠는 ai기술을 두고 "AI는 한계가 없는 최초의 기술" 이라고 인터뷰하기도 했다.



8. 트위터 찌라시가 뭔가요?

: 트위터(현 X)는 미국에서 가장 인기 있는 소셜 플랫폼으로, 빅테크 연구원들을 포함한 정말 많은 사람들이 이를 이용하고 있다.

특갤에서 트위터 찌라시라고 하면, 이름과 얼굴 및 소속을 공개한 빅테크 연구원들과, 자칭 'AI정보 유출자' 라고 하는 정체불명의 사람으로 구분할 수 있는데, 이이 종종 '대중들이 믿지 못할만한 기술, 현상이 일어날 것이다' 와 같은 말들을 하는 것을 의미한다.


전자는 트위터에 글을 작성한 놀라운 일들이 대체로 사실이었고 머지 않아 그 기술이 포함된 제품을 출시함으로써 증명한 경우가 많았다. 그래서 전자는 보통 찌라시라고 부르지 않는다.

이를테면, 2024년 여름엔 구글 딥마인드의 연구원이 '2025년에는 초인적인 수학 능력을 지닌 ai가 나올 것이다' 라는 트윗을 했고, 본인을 포함해서 대부분의 특갤러들이 말도 안 된다면서 욕설을 했다.

(수학 능력은 추론 능력과 밀접하게 연관되어 있는데, 추론 능력이 상승한다는 것은 agi로의 길에 가장 큰 장애물이 치워진다는 뜻이기에 반신반의할수밖에 없었다. 더군다나 당시는 수학에서의 굉장한 발전을 보인 o1 모델이 공개되기 전이었다.)

그러나, 3주쯤 뒤 구글 딥마인드의 알파프루프 AI모델이 국제 수학 올림피아드에서 은상을 차지하고 2달쯤 뒤 OAI의 o1 모델이 발표되며 이를 증명해낸 적이 있었다.


후자는 'OO 회사의 OO 모델이 내일 출시될 것이다.' 와 같은 발언을 하는데, 물론 근거는 없지만 여기에 기대를 거는 특갤러들은 새벽 2-3시까지 깨어 있으면서 신모델을 기다리기도 한다. (미국 LA의 아침 시간대가 한국의 새벽 2-3시이기 때문) 경험상 9번 틀리고 1번 맞춘다.


괜히 얼굴도, 이름도, 소속도 모르는 이상한 트위터 어그로꾼 이야기에 흔들리지 말고 자도록 하자. 몇시간 늦게 본다고 세상 안 망한다.

정말로 굳이 후자 찌라시를 보고 싶다면, '지미애플', '룬' 이 두사람 정도(OpenAI 사의 내부 직원이라는 근거가 많음, 특히 지미애플은 OAI내부 소식뿐만 아니라 타 기업들의 소식까지 많이 맞추며 내부자 중에서도 고위급 아니냐는 추측이 있다.)만 보고 나머지는 클릭조차 하지 말자.



9. 한국 기업이나 학계의 의견이 상대적으로 저평가되는 이유가 뭔가요?

: 모든 것은 위 2번에서 소개한 트랜스포머 논문의 근본 구조 때문이다.

최근에는 고품질 데이터 사용과 추론 시간을 늘림으로써 스케일 향상 없이 (그래픽카드의 양과 질을 늘리지 않고도) 모델의 성능을 많이 개선할 수 있다고는 하지만, 그래도 근본 구조가 구조이니만큼 스케일의 향상과 (그래픽카드의 양과 질을 늘릴수록) 모델의 성능은 비례하는 것은 변하지 않는다.

모델의 학습에 사용되는 그래픽카드는 크게 엔비디아에서 2020년에 출시된 A100, 2022년에 출시된 H100, 2024년에 출시된 GB200 모델로 구분된다. (구글의 TPU나 기타 업체 등도 있긴 하지만 비주류니 생략)

여기서 각각의 그래픽카드는 벤치마크마다 조금 차이는 있지만 가장 중요한 학습 성능만 보면, 최소 4배에서 9배 정도까지 성능 차이가 있다. 극단적으로 비교하면, A100모델에 비해 GB200모델은 16배에서 81배까지 성능이 좋을 수 있다는 것이다. 이런 GB200모델 그래픽카드를 이 글을 쓰는 24년 10월 기준으로, 최소 12개월 생산되는 모든 물량을 미국의 빅테크가 쓸어가서 품절 상태이다.


주요 LLM모델을 개발하는 회사들 중 덩치가 작다는 그록(X) 마저도 24년에는 H100 10만대를 통해 모델 훈련 (25년에는 GB200 30만대를 사용해 훈련할 예정)을 하고 있는데, 현재 LLM모델 개발의 최선두를 달리는 OpenAI는 마이크로소프트와 손잡고, 무려 5000억 달러 이상 규모로 구성된 일명 '스타게이트' 프로젝트를 확정했다.



아래부터의 설명은 절대로 국내 연구진과 기업인, 관련된 인물들을 비하할 의도가 없음을 알린다.

그에 비해 한국에서 가장 많은 그래픽카드를 보유한 네이버와 삼성은 각각 H100 1,000대를 보유한 상황이다. 애초에 미국의 빅테크와 아예 게임이 안 되는 것이다. 한국에서 최고의 컴퓨팅 성능을 가진 성균관대학교는 A100 40대 수준이고, 해외의 날고 긴다 하는 최고 명문대들도 빅테크와 비교하면 새발의 피 수준인 그래픽카드를 보유하고 있다. (미국 프린스턴 대학교-H100 30대) 그래서 한국의 기업들과 국내외의 학계 의견이 상대적으로 저평가 되는 것이다.


학계 등에서 OO가 불가능하다!! 라는 논문이 나오면, 얼마 지나지 않아 빅테크가 OO가 가능한 모델을 출시하는 것이 아주 일반적이다.

지금 당장 생각나는 것만 해도, 딥러닝 한계론/LLM 추론 불가능론/합성 데이터 불가론/학습 데이터 오염론 등이 논문으로 나온 것이 생각나는데 귀신같이 몇 주 지나지 않아 출시된 새 모델에 의해 반박된 것이 인상적이었다.


만약 OpenAI, 구글, 앤트로픽 이 세 기업에서 부정적인 논문이 나오면 반드시 귀 기울여 들어야겠지만,

개인적으로 느낀 바로는 필자가 이제까지 특갤 하면서 느낀점은 이 세 기업이 아닌 곳에서 내는 논문은 우리들이 크게 마음 쓸 필요가 없다는 것이다.



10. 벤치마크를 알려주세요!

(공개 - 벤치마크 조작/오염/학습 가능성 있음. 비공개 - 벤치마크 조작/오염/학습 가능성 없음.)

(수학과 같이 정답이 정확히 존재하는 벤치마크가 아닌 이상 일반적으로 벤치마크가 90%을 넘어가면 만점으로 취급한다.)

수많은 벤치마크들이 있지만, 대다수 전문가가 인정하고 범용적으로 사용되는 벤치마크만 나열하였다. 쓰이지 않는 벤치마크는 그 이유가 있다. (데이터 오염, 통일성 부족, 평가 능력 부족 등)


MMLU : 중-고등학생 수준의 일반 상식을 객관식으로 묻는 공개 4지선다 벤치마크. 22년 11월 gpt 3.5 모델이 70%을 받은 이후 대부분의 모델들이 기본으로 90%에 근접한 점수를 내어 벤치마크가 포화되어 현재는 사용되지 않는다.

MMLU-PRO : MMLU 벤치마크에서 난이도를 올리고, 단순 암기 문제에서 추론이 필요한 문제를 묻는 공개 10지선다 벤치마크. 약 12,000개의 문제들로 구성되어 있음. 현재는 o1 모델이 92.4%를 달성하여 사실상 의미가 없어졌다.


아래부터는 모두 비공개 벤치마크이다.


GPQA : 생물학/화학/물리학 분야에서 박사 수준의 추론능력을 묻는 주관식 벤치마크. 박사 평균이 65%/일반인이 모든 검색 수단과 무제한 시간을 주었을때 34%를 달성하는 어려운 벤치마크. o3 모델이 87.7%을 달성하였다.

AIME : 미국의 수학 영재 중의 영재들을 대상으로 하는 수학 경시대회. 후술할 테렌스 타오가 13세의 나이에 34/45점을 받고, IMO(국제수학올림피아드) 에서 금메달을 받아 유명해졌다. 23년 4월에 공개된 gpt-4는 12%의 정답률을 기록했으나, 24년 12월에 공개된 o3은 96.7%의 정답률을 기록하였다.

CodeForces(코드포스) : 프로그래밍 경쟁 대회. 다양한 알고리즘 문제를 풀어 순위를 매기는 대회로, 모델의 '지능'과 밀접하게 연관되어 있다. o3 모델이 국제 그랜드마스터 레벨 - 전 세계 사람들 중 175위를 기록하였다. 한국인 중에서 이보다 뛰어난 등수를 가진 사람은 1-2명이 존재한다.

SWE-Bench : 실제 Github에 있는 프로젝트 수행 능력을 평가하는 벤치마크. 모델의 '실제 업무 능력'과 밀접하게 연관되어 있다. 단순히 IQ가 높다고 일을 잘하는건 아니듯이, o1 모델은 코드포스 점수는 높았으나 이 벤치마크 점수는 낮아 (48.9%) '괴리감이 있다' 라고 하는 사람들이 있었는데, o3 모델은 71.7%를 기록하였다.

ARC-AGI : LLM으로써 AGI를 달성하기 위해 '인간처럼 생각하는 능력' 을 평가하는 벤치마크. 인간에게는 쉽지만 LLM에게는 굉장히 어려운 벤치마크인데, 사전 지식이나 경험에 의존하지 않고 매우 제한된 예시에서 새로운 기술을 즉석에서 추론하여 패턴을 파악해야 하기 때문이다.

이 벤치마크를 제작한 프랑수와 솔레(Keras 라이브러리 개발, 구글 9년 근무 뒤 최근 퇴사)는 o3모델 공개 직전까지 강성 LLM 회의론자였으나, o3 모델 공개 이후 본인이 제시한 agi 수준(85% 정답률)을 뛰어넘자 '벽은 없다'와 같은 말을 하기도 했다.

FrontierMath (프론티어매쓰) : 현존하는 최고 난이도의 벤치마크. 14명의 국제수학올림피아드/필즈상 수상자를 포함해 세계 최고 지능의 박사급 수학자들이 모여서 만든 문제로 구성되어 있다. 테렌스 타오(현 시대의 최고 두뇌로 평가받는 수학자)조차 자기 분야가 아니면 풀지 못할 정도의 문제로 구성되어 있는데, o3 출시 이전에는 o1 모델조차 1-2%에 그치는 등 난공불락의 영역으로 여겨졌으나 o3모델이 25%를 기록하였다.



11. AI기술이 발전했다고 하는데 전 체감이 안 돼요! // 공지 위반이 아닌거 같은데 차단당했어요!

: 그럴수 있다. 사람의 특성에 따라, 관심사에 따라, 직업에 따라, 거주하는 나라에 따라서도 사람마다 느끼는게 다를 수가 있다.

하지만, 특이점이 온다 갤러리는 기본적으로 과학기술에 대해 관심을 가지고 기술적 특이점에 관한 정보들을 공유하는 사람이 모인 곳이다. 이런 사람들이 모인 커뮤니티에서 굳이 레퍼런스 없이 자신의 주장을 퍼뜨리고 납득시키려 노력할 이유는 없을 것이다.

또한 가면을 쓴 선형주의자들의 분탕이 지속적으로 이루어지는 곳이기도 하다. 실제로, 본 갤러리 분탕만을 목적으로 하는 외부 집단이 내부자에 의해 폭로된 적도 있다.

정말 그럴 의도가 아니었을지라도, 어그로가 많이 끌린다면 글이 삭제되고 심할 경우에는 차단될 수 있다. 나중에 AI기술에 대해 관심이 생긴다면, 그때 방문한다면 고맙겠다.


또한 공지 위반이 아닌데 차단당했다면 정말 미안하게 생각하는 바이다.

본 갤러리는 어떻게든 분탕을 치고자 가면을 쓰고 어그로를 끄는 사람들이 많은 곳이다. 완장들이 이들을 차단하는 과정 중, 실수로 차단되었을 수도 있고 완장도 사람이니만큼 실수가 있을 수가 있다.

이런 경우에는 공지사항 신문고의 댓글이나, 매니저의 방명록에 차단당한 IP(또는 식별코드), 시간, 사유를 간략히 적어 주면 정말 악의적인 분탕만 아니면 어지간해서는 차단 시간 줄여주거나 해제처리 하니깐 적극적으로 댓글을 달아주면 좋겠다.



12. 관련 인물 및 용어 정리

레이 커즈와일 : 2005년 책 '특이점이 온다', 2024년 책 '특이점이 더 가까이 온다' 를 서술한 인물. (꼭 이 책들을 읽을 필요는 없다. 도서의 특성상 기술 발전 반영이 굉장히 느리기도 하고, 본 갤러리 정보탭만 보아도 된다.) 특갤에서 일반적으로 '갤주' 라고 불린다. 만약 특이점이 오기 전 사망한다면 냉동인간이 되겠다는 발언을 하여, 농담삼아 '냉동참치' 라고도 한다.

G/N/R 3가지로 자기 주장을 펼쳤는데, G(유전공학),N(나노로봇) 에 대한 주장은 크게 빗나갔지만

G와 N을 실현하는데 가장 중요한 R(로봇공학) = 인공지능에 대한걸 상당히 정확하게 예측하였다.

레이 커즈와일이 과학적으로 대단한 업적이 있어서 갤주 대접을 한다기 보다는, 특이점이라는 개념을 대중화시킨 사람이라 갤주 취급을 받고 있다.


샘 알트만 : OpenAI의 초대 이사진 겸 CEO. AI발전 가속주의자. 경영가.

별명으로는 '트위터에서 글만 쓰고 정작 제품을 내놓지 않는다' 는 것을 조롱하는 의미로 '아가리 털드만'이 있었으나, 이 이유가 회사 내 안전주의자들의 반대때문이었던 것이 밝혀지며 최근에는 거의 사용되지 않는다. 24년 10월 기준으로 쇼앤프루브를 아주 잘 해주고 있어, 평이 매우 좋다.

가끔씩 특갤에서 알트만 욕하기 WWE가 열릴 때가 있는데, 개인적으로는 특갤러들이 도파민이 박살나서 그렇다고 생각한다. 다만 다른 빅테크 기업에 비해 유독 OAI의 직원들이 트위터로 입을 터는 경향이 있는건 사실이지만, 입을 놀린 만큼 지금까지 계속 쇼앤프루브를 해 왔다는 점을 기억하자.


일리야 수츠케버 : SSI(초지능 안전 개발 기업)의 CEO. (전) OpenAI의 초대 이사진 겸 최고 기술 책임자. AI발전 안전주의자.

현 시대에 AI개발에 있어 최고 기술자 및 두뇌로 평가받는 사람이다. 후술한 일리야의 스승 제프리 힌튼이 80세의 나이에 논문 피인용수 85만회를 달성했으나, 일리야는 40세의 나이에 논문 피인용수 55만회를 달성할 만큼 범지구적인 천재이다.


힌튼의 발언에 따르면 직관이 매우 뛰어나다고 하며, 후술할 GPT-3 개발 이후, AI발전의 가속주의/안전주의에 대한 의견 차이로 안전주의자들이 OpenAI에서 앤트로픽으로 죄다 이동한 이후 내부에 기술진이 죄다 털려있던 OpenAI에서 혼자 주도적으로 GPT-4를 개발하며 전세계적인 초대박을 터뜨렸다.

그러나 샘 알트만과 가속주의/안전주의에 대한 지속적인 트러블 때문에 OpenAI를 퇴사하여 SSI라는 초지능 안전 개발 기업을 차리고 본인의 이름값 하나로만 1조 5천억원을 투자받았다.


제프리 힌튼 : AI 4대 석학 중 우두머리, AI발전 안전주의자. 노벨상 수상자. 튜링상 수상자.

현대 AI의 근본이 되는 수많은 논문들을 작성하였고, AI분야의 최고 대부로 평가받고 있다.

축구로 비유를 하자면 힌튼은 메시-호날두고 일리야는 음바페 정도가 되겠는데, 이 사람이 없었다면 트랜스포머 모델은 커녕 현대에 AI라고 불리는 것 자체가 없었을 수도 있다는 의견이 있을 정도로 중요한 인물이다.

현재는 80대인 그의 나이 탓에, 현직에서는 물러나고 기업의 고문으로 활동하고 있다. 수년 내 인류에게 큰 재앙이 될 초지능이 도래하리라는 입장을 지니고 있다. 그래서 기본 소득과 같은 사회 안전망을 빨리 도입해야 한다고 주장하고 있다.


얀 르쿤 : AI 4대 석학 중 한명. 튜링상 수상자.

힌튼의 아래에서 연구를 수행한 적이 있으며 힌튼만큼이나 중요한 각종 논문들을 작성하였다.

LLM으로 AGI가 힘들다는 주장을 견지했으나, 24년 9월 이후로는 스탠스가 바뀐 모습을 보여주면서 메타의 AI팀 최고 책임자로 일하고 있다.

메타의 AI팀에서는 LLM을 이용한 모델(라마)를 출시하고 있고, 본인이 AGI에 도달할 수 있다고 주장하는 제파 모델은 연구 성과도 전혀 내지 않고, 하루종일 트위터에 정치적인 장문의 글만 써대는 탓에 특갤에서 반농담식으로 '이새끼 일은 하는거 맞나' 라는 식으로 까기도 한다.


앤트로픽 : OpenAI에서 AI가속발전/안전에 대한 의견 차이로 갈라져 나온 회사.

아마존을 투자 뒷배로 두고 있으며, 초대 기술진들을 죄다 흡수한 만큼 기술력은 OpenAI에 뒤지지 않는 것으로 평가되고 있으나,

안전에 대한 검열을 이유로 모델의 출시가 늦고 뭐만 하면 검열 답변을 띄우는 탓에 성능이 상대적으로 떨어진다는 불만이 있다.

다만, 24년 12월 시점에서는 이렇다 할 모델 출시가 없어 과거 OAI-앤트로픽-구글 2강 1중의 구도에서 OAI-구글-앤트로픽의 2강 1중의 구도로 변화한게 아니냐는 말들이 나오고 있다.


구글 : OpenAI가 이들의 AI 발전 독주를 저지하기 위해 설립될 정도로, 알파고 즈음의 시기에서 AI의 아주 절대적인 강자로 군림하고 있던 기업이었다. 그러나 기술력이 생명인 이 분야에서 구글은 검색 엔진 점유율을 깎아먹기 싫다는 이유로 AI 기술 팀을 무려 2년간 휴가를 보냈다(놀랍지만 진짜임).

2022년 11월, GPT-3.5 공개 이후 위기감을 느낀 구글은 급히 바드(현 제미니) 모델을 개발했지만, 검열 등의 이유로 과거의 명성이 무색하게 OpenAI의 뒤를 쫓고 있다. 구글의 압도적인 데이터 보유량, 자원, 인재 등을 고려하여 붙은 '치타'라는 별명이 있다.

농담 삼아 OAI 제품 발사대라고도 불리며, 2024년 12월에는 OAI의 원탑 위치를 위협할 정도로 발전한 제품들을 출시하였으나, 며칠 만에 OAI에서 O3 모델을 출시하며 여전히 OAI와의 격차를 따라가지 못하고 있다.


23년 11월 OpenAI 알트만 해임 사태 : OpenAI의 AI발전 안전주의자들이 기습적으로 가속주의자들을 해임한 사태를 의미한다. 며칠 지나지 않아 마이크로소프트(최대 투자자) 등의 전폭적인 지원으로 가속주의자들이 제자리를 되찾았다. 24년 10월의 OpenAI는 최후의 안전주의자였던 '미라 무라티'가 퇴사하며 가속주의자들이 명확하게 주도권을 잡았다.



자동등록방지

추천 비추천

42

고정닉 20

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
3004 설문 소속 연예인 논란에 잘 대응하지 못하는 것 같은 소속사는? 운영자 25/04/21 - -
공지 뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250308) ㅇㅇ갤로그로 이동합니다. 24.11.23 31303 42
609935 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [1] ㅇㅇ갤로그로 이동합니다. 25.01.18 12590 27
571620 공지 본 갤러리는 타 갤러리 분탕과 관계 없음을 밝힙니다. [1] ㅇㅇ갤로그로 이동합니다. 24.11.23 5385 15
572292 공지 직업 비하, 조롱 글 30일 차단됩니다. ㅇㅇ갤로그로 이동합니다. 24.11.24 4682 6
710801 일반 특린이인데 agi 질문좀 야끼교자갤로그로 이동합니다. 14:25 6 0
710800 일반 공홈 veo가 더 안좋은점 갉달비갤로그로 이동합니다. 14:21 33 0
710799 일반 LLM 이미지인식 보면 선천적 시각장애인 일화 생각남 [2] 빗소리P갤로그로 이동합니다. 14:17 65 1
710798 일반 ai가 동영상도 보고 학습하는 기술 개발중임?? ㅇㅇ갤로그로 이동합니다. 14:17 24 0
710797 일반 oai는 진짜 사용자가 많은 게 단점이네 ㅋㅋ [1] 메론맛콜라가먹고싶어갤로그로 이동합니다. 14:16 106 0
710796 일반 한국이 포르노.성인물이 불법인 나라이긴 하지만... ㅇㅇ갤로그로 이동합니다. 14:14 98 0
710795 일반 나도 개념글대로 해도 못찾는데 ㅇㅇ(115.139) 14:12 41 0
710794 일반 o3 환각 좀 다른 원인이 있을거 같은데 [1] ㅇㅇ갤로그로 이동합니다. 14:11 92 2
710793 일반 포켓몬 적버전 ai가 정복하면 다음 겜은 뭘까 [1] 웰치스빈갤로그로 이동합니다. 14:09 50 0
710792 일반 개념글대로 위치 못찾는데 [6] chatgpt4o갤로그로 이동합니다. 14:05 125 0
710791 일반 음성모드 영어 회화 연습 괜찮음? ㅇㅇ(39.118) 14:02 27 0
710790 일반 5억년 버튼 갖고 또 싸우네 [42] ㅇㅇ갤로그로 이동합니다. 13:55 263 0
710789 일반 잼미니 = 공앱 잼황=ais , 공웹 [4] 끼랑까랑갤로그로 이동합니다. 13:52 159 1
710788 일반 저출산 걱정도 사실 가스라이팅이지 [4] ㅇㅇ(118.176) 13:50 134 0
710787 일반 포켓몬 관련해서 oai 짜치는 점 [3] ㅇㅇ(27.124) 13:49 135 4
710786 일반 4월의 승자 모델은 누구일까 [5] 갉달비갤로그로 이동합니다. 13:47 154 2
710785 일반 깃허브에 자가의학진단 에이전트 올리면 법쪽으로 문제있나? [4] ㅇㅇ(125.242) 13:46 98 0
710784 일반 o1 pro vs o3 머가 더 나음? [1] ㅇㅇ(112.153) 13:45 70 0
710783 일반 잼민이 2.5 프로도 멍청함 천문학 잘 모름 ㅇㅇ(183.107) 13:41 68 0
710782 일반 GPT는 너무빨아줘서 공부할때는 그록 잼민이써야함 [3] ㅇㅇ갤로그로 이동합니다. 13:40 126 1
710780 일반 지금 21살 다이아수저로 살기 vs 20년후 21살 다이아수저 [6] ㅇㅇ(112.153) 13:35 145 0
710778 일반 근데 젬황은 이미지를 직접 읽는다매 [5] ㅇㅇ(115.139) 13:31 199 0
710777 일반 젬황... [23] ㅇㅇ(220.89) 13:28 1091 20
710776 일반 구글 io가 5월 며칠에 하는 거임? 한국 시간 기준으로 [1] ㅇㅇ갤로그로 이동합니다. 13:26 79 1
710775 일반 아니 제미니 미쳤는데? [5] 페어웨이굴삭기갤로그로 이동합니다. 13:26 257 1
710774 일반 투표)GPT-5 출시 월 예상 분노의라스갤로그로 이동합니다. 13:20 148 1
710773 일반 gpt 알아서 만들어줄테니 기다리라는 [1] ㅇㅇ(59.14) 13:18 96 0
710772 일반 gpt 4o 프롬 길이제한 무료 이용자만 걸리는거임?? ☎세미나인♪갤로그로 이동합니다. 13:18 85 1
710771 일반 만약에 특이점이 온 ai 로봇에 귀신이 깃든다면 [8] 밴조갤로그로 이동합니다. 13:07 150 0
710769 일반 Gemini 포켓몬 벤치의 의의는 딱 하나임 ㅇㅇ [4] ArchitectOT갤로그로 이동합니다. 13:01 321 6
710768 일반 재미니 우쭈쭈 [3] (1.224) 12:59 155 0
710767 일반 강화학습 말고는 AGI 답 없어보임 [7] 덕수옹갤로그로 이동합니다. 12:56 279 1
710766 일반 코딩 원툴 쏘넷이냐? [1] ㅇㅇ(182.208) 12:56 67 0
710765 일반 지피티 업데이트 됨? [1] ㅇㅇ(1.226) 12:55 153 0
710764 일반 사용량이 많다고 성능이 떨어지나? [1] ㅇㅇ(14.53) 12:51 91 0
710763 일반 근데 요즘 벤치 너무 많아짐 [5] ㅇㅇ갤로그로 이동합니다. 12:46 169 0
710762 일반 옆동네에 제미나이 쓰다 정지당한거 있내 ㅋㅋ [4] ㅇㅇ갤로그로 이동합니다. 12:42 667 9
710761 일반 왜 법조계•의료계는 ai에 아직 대체되지 않았는가? [28] ㅇㅇ갤로그로 이동합니다. 12:41 318 3
710760 일반 제미니 앱은 진짜 쓰기 불편하네 ㅇㅇ(211.215) 12:41 77 0
710759 일반 챗gpt는 도대체 어디 자료를 기반으로 알려주는거임??? [4] ㅇㅇㅇ1갤로그로 이동합니다. 12:36 173 0
710758 일반 gpt한테 뭐 소스 만들어달라고 하니까 몇시간을 기다려 달라는데 [1] ㅇㅇ(115.22) 12:35 57 0
710757 일반 챗지피티vs제미니 결제하려는데 뭐가 좋나요 [9] ㅇㅇ갤로그로 이동합니다. 12:34 158 0
710755 일반 근데 애초에 제미니 포켓몬은 딥마인드가 돌리는게 아님 [1] ㅇㅇ(220.83) 12:29 126 3
710754 일반 재미나이 구독 안하고 걍 ais 쓰면 됨? [6] BODIE갤로그로 이동합니다. 12:27 198 0
710753 일반 Ai studio는 모바일 안되지? [3] ㅇㅇ(211.217) 12:23 170 0
710752 일반 LLM의 창의성에 대한 데미스 하사비스 인터뷰 [3] ㅇㅇ(222.109) 12:22 222 3
710751 일반 4o요즘 너무 간신배 같아짐 [9] ㅇㅇ(49.109) 12:20 272 5
710750 일반 제미니 VS 챗 지피티 수백번 돌려보고 결론 [5] 초지능자(122.254) 12:16 300 0
710749 일반 오픈AI직원이 포켓몬 벤치 의미 없다한 EU [4] 젬황갤로그로 이동합니다. 12:15 387 6
710748 일반 제미니 왜이럼? ㅇㅇ(221.164) 12:15 63 0
뉴스 [NP포토]은지언니(이은지), '사랑을 부르는 하트 ' (케이스키니X마노패밀리) 디시트렌드 10:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2