디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

6년 만에 공개 모델 내놓은 오픈AI, gpt-oss에 깔린 의도는 순수할까

IT동아갤로그로 이동합니다. 2025.08.06 11:30:28
조회 2945 추천 0 댓글 0
[IT동아 남시현 기자] 오픈AI가 GPT-2 이후 6년 만에 새로운 오픈소스 모델인 gpt-oss를 출시했다. 우리가 익히 사용한 GPT-3부터 최신 모델인 GPT-4o, o3 등 모델은 매개변수, 학습 데이터 등이 공개되지 않는 폐쇄형(closed source) 모델이었지만, 이번에 공개된 gpt-oss는 20B(210억 개) 및 120B(1170억 개) 매개변수가 탑재된 공개형(Open Source) 모델이다. 오픈AI는 GPT-2 이후로 유료 폐쇄형 모델만 내놔 지나치게 상업적이라는 비판을 받아왔지만, 이번 오픈소스 모델 출시로 이러한 세간의 의식을 피할 수 있게 됐다.


오픈AI가 현지시간으로 8월 5일, 6년 만에 오픈소스 모델인 gpt-oss를 공개했다 / 출처=오픈AI



오픈소스 모델은 누구나 무료로 이용하고 가공할 수 있으며, 전체 데이터를 다운로드해 인터넷 연결 없이도 온디바이스 AI로도 구동할 수 있다. 기존 유료 폐쇄형 모델인 앤스로픽 클로드와 구글 제미나이는 매출, 점유율에 직접적인 타격을 입을 전망이다. 성능 면에서 GPT-4o와 비슷한 수준이라는 점이 알려지며 오픈소스로 시장 확장을 노리던 메타, 딥시크, 알리바바 등도 전략 수정이 불가피할 전망이다. 오픈AI의 오픈소스 출시로 인해 인공지능 업계 전반의 지각이 바뀔 것이라는 게 중론이다.

초고성능 120B 모델, 보편적 성능의 20B 모델 각각 출시


오픈AI가 출시한 모델은 gpt-oss-120b와 gpt-oss-20b 두 종류며, 아파치 라이선스 2.0을 적용받는다. 해당 라이선스는 오픈소스 라이선스로 저작권, 특허, 상표권은 그대로 유지한 채 사용해야 하며, 수정 사항을 고지하면 소스 코드의 일부를 추가하거나 수정할 수 있다. 또한 2차 창작과 상업적 이용, 변형물에 대한 특허까지 출원할 수 있다. 아파치 라이선스 2.0으로 배포했다는 것은 배포 기업이 상업적인 이윤을 사실상 포기하고 시장 점유율 확대와 생태계 성장을 위해 소프트웨어를 내놓겠다는 의미에 가깝다.

오픈AI는 gpt-oss가 다양하게 활용될 수 있도록 추론 성능, 효율성, 실사용도에 중점을 두고 훈련했다. 기능 면에서는 질문을 분석한 뒤 특화된 부분이 나서 작업하는 전문가 혼합(Mixture-of-Experts, MoE)을 활용해 효율성을 끌어올렸고, 문장을 이해할 때 중요한 단어를 집중 분석하는 희소 어텐션도 사용된다. 또한 모델이 문장의 단어 순서를 정확하게 이해하도록 돕는 회전 위치 임베딩(RoPE)을 통해 최대 12만 8000단어의 긴 내용까지 한 번에 인식한다.


gpt-oss-120b 및 20b 모델과 o3, o4-mini, o3-mini 모델의 성능 비교표 / 출처=오픈AI



성능면에서 gpt-oss-120b 모델은 작업당 한 번에 51억 개의 매개변수를 끌어다 쓰며, 기존의 o4-mini와 거의 동등한 성능을 낸다. 크기가 작은 20b 모델은 전반적으로 o3-mini와 비슷한 성능을 낸다. 오픈AI가 코딩, 경쟁 수학, 의료, 에이전트 도구 등의 벤치마크로 o3, o4-mini, o3-mini 모델과 비교한 자료에 따르면, 코드 성능은 gpt-oss-120b가 2622점으로 2706점인 o3와 비슷하다. 코딩 도구 없이 비교한 결과에서는 gpt-oss-20b가 2230점, o3-mini가 2073점으로 높게 나왔다.

AIME 2024, 2025 등 수학테스트, 의료 시험, 대학원급 AI 문제 등 전반적인 벤치마크에서 두 모델 모두 폐쇄형 모델인 o3, o4-mini와 큰 차이가 없었다. 다만 100개 분야에 걸쳐 최상의 난이도 문제 2500개로 구성된 ‘인류의 마지막 시험’ 벤치마크에서는 o3의 성능이 월등히 높았다. o3가 폐쇄형 모델이므로 점수가 더 높은 구체적인 이유를 판단하기는 어렵지만, gpt-oss보다 도구 사용에서 더 효율적인 것으로 유추할 수 있다.

추론의 방향성 짚는 ‘사고 사슬’은 왜 공개하지 못할까


오픈AI는 gpt-oss에 사고 사슬(Chain-of-Thought)에 직접적인 지도를 적용하지 않았다. 사고 사슬은 ‘왜 이런 답이 나왔는지’를 단계적으로 생각하는 추론 과정을 풀이해서 보여주는 기능이다. 최근 연구에서 사고사슬을 관찰하는 것이 오작동을 탐지하는데 도움이 될 수 있다고 밝혀졌지만, 이를 훈련시키지 않는 것이 더 안전한 결과를 내놓는다는 게 오픈AI의 입장이다. 만약 추론 과정을 건드릴 경우 추후 어떻게 오작동을 일으키는지 파악하기 어려워질 수 있으니 오작동 탐지를 위해서라도 건드리지 않겠다는 것이다.


GPT의 사고사슬이 동작하는 예시 / 출처=오픈AI



이에 따라 개발자들은 사고사슬의 동작 흐름을 일반 사용자들에게 노출시켜선 안되며, 단지 오작동 확인 용도로 쓰는 게 권장된다. gpt-oss 기반의 챗봇이나 서비스 등을 만들었을 때 사용자는 결론만 제공받고 어떻게 그 결과를 내놨는지까지는 알지 못하게 하라는 것이다.

사고사슬을 공개하지 않는 이유는 여러 가지가 있다. 일단 개발자가 사고사슬을 노출함으로써 발생할 수 있는 문제를 회피하기 위해서다. 도출된 결과와 달리 사고사슬 자체에 유해하거나 문제가 되는 내용 등이 포함될 수 있는데 이것이 노출돼 발생하는 문제는 오픈AI가 책임지지 않겠다는 의미다. 또한 사고 과정 자체가 오픈AI 입장에서는 향후 모델 개발을 위한 중요한 자산이며, 이것이 타의에 의해 왜곡되는 것을 막겠다는 취지도 있다. 오픈AI가 미처 탐지못한 오작동이나 모델의 문제점을 수집하려는 의도도 있다.

즉 사고사슬을 대외적으로 노출하지 말라는 지침은 오픈AI의 데이터 수집 순수성을 확보하고, 향후 사고사슬 노출로 인해 발생할 수 있는 법적, 윤리적 책임에서 벗어나기 위한 목적이 있다.

허깅페이스에서 무료로 제공, 거의 모든 시스템에서 사용 가능



허깅페이스에 등재된 gpt-oss-120b 모델, 개발자 누구나 다운로드해서 무료로 사용할 수 있다 / 출처=IT동아



gpt-oss-120b 및 oss-20b 모두 오픈소스 LLM 배포 플랫폼 ‘허깅페이스’를 통해 배포된다. 동작 환경은 엔비디아 H100 80GB 한 대로 120b 모델을 구동할 수 있고, 16GB 메모리만으로 20b 모델을 실행할 수 있다. 120b 모델 자체는 개발 환경용 고성능 컴퓨터에서 가능하고, 20b는 노트북과 데스크톱은 물론 임베디드 시스템, 엣지 컴퓨터 등 소형 장치에서도 사용할 수 있다.

오픈AI는 이미 허깅페이스 이외에도 MS 애저, vLLM, 올라마(ollama), 라마.cpp, LM 스튜디오, AWS, 파이어웍스, 투게더AI 등의 배포 플랫폼을 통해 모델 접근을 허용했으며, 엔비디아, AMD, 세레브라스, 그록(Groq) 등의 하드웨어에서 이용할 수 있도록 최적화했다. 마이크로소프트는 gpt-oss-20b 모델의 최적화 버전을 윈도우 버전으로 출시할 예정이다.

6년 만에 오픈소스 내놓은 오픈AI, 속내는?


오픈AI가 처음 출범했을 때 ‘오픈AI는 비영리 인공지능 연구기업이며, 재정적 수익 창출의 필요성에 구애받지 않고 인류 전체에 큰 혜택을 줄 방식으로 디지털 지능을 발전시키는 것’으로 소개됐다. 하지만 오픈AI는 GPT-3로 큰 성취를 맛본 이후 최근까지도 최신 모델을 폐쇄형 유료 모델로 운영해 왔고, 지난해에는 독립 영리 법인 분사 계획까지 들고 나왔었다. 업계의 엄청난 비난으로 인해 공익 기업으로 재편하고 비영리 이사회가 계속 지배하는 구조로 회귀했지만 여전히 오픈AI를 바라보는 업계의 시선은 따갑기만 하다.


이미 개발자들이 gpt-oss 기반으로 무료 서비스들을 내놓기 시작했다. 사진에 있는 서비스는 기존 유료 버전을 활용한 서비스들 / 출처=오픈AI



지금이라도 오픈AI가 오픈소스 모델을 출시한 것은 전략의 다변화에 기인한다. 이번 gpt-oss 출시로 예산이 부족하거나 고성능 모델을 쓰기 어려운 개발 환경 등에서 고성능 모델을 활용하게 됐고, 민주적인 AI 기술 활용에 기여한다. 물론 순수한 의도만 있는 건 아니다. ‘최상위 포식자’에 가까운 오픈소스 모델이 출시됨에 따라 기존 오픈소스 LLM 생태계가 오픈AI 중심으로 재편될 여지가 있고, 지나치게 시장 점유율이 높아질 경우 오픈AI 자체에 기술이 종속될 수 있다.

이번 공개를 놓고 오픈AI는 ‘향후 오픈AI가 개방형 모델에 투자할만한 가치가 있는지를 알아보기 위해 자체 개방형 모델을 출시했다. 이 모델의 강점과 실제 응용분야에 대한 피드백을 보내면 의사 결정에 중요한 역할을 할 것’이라고 덧붙이고 있다. 즉 향후 오픈소스가 시장 지배적인 역할을 할지 판단하기 위해 공개했다는 의미가 깔려있다.

오픈AI는 지난주 AI가 결과까지 수행하는 챗GPT 에이전트를 공개했고, 조만간 GPT-5도 공개할 예정이다. 샘 알트만 오픈AI CEO는 GPT-5를 놓고 ‘내가 쓸모없다고 느껴지는 이상한 감정이 들었다’라며 GPT-5의 성능을 자랑하기도 했다. 이번 오픈소스 공개 역시 순수한 의도보다는 업계 영향력 강화를 위한 시도에 가깝다. 또 한 번 오픈AI가 AI 업계를 뒤흔들어 놓을 것으로 보이지만 무조건 긍정적으로만 볼 수 없는 게 현실이다.

IT동아 남시현 기자 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 닻 올린 '한국형 AI'··· 각 컨소시엄 구성과 목표, 그리고 해외 동향은▶ “AI 반도체는 GPU 대안 아닌 새로운 방향··· 메모리 접근해 LPU 차별화”▶ [스케일업] 퍼슬리 [1] 케어닥 “사업의 도구와 본질 구분하고, 성장 단계별 목표 세워라”



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 연말 모임 가는 곳마다 가장 인싸일 것 같은 스타는? 운영자 25/12/08 - -
6257 서울과기대의 단계별·맞춤 제조창업 지원, 그 6개월 간의 여정 짚어보니 IT동아갤로그로 이동합니다. 11:47 5 0
6256 세종테크노파크 “충청 정보보호클러스터 이끌 기업 오라” IT동아갤로그로 이동합니다. 11:20 3 0
6255 SBA 틱톡 동남아와 MOU "서울 우수기업 세계화" IT동아갤로그로 이동합니다. 10:19 4 0
6254 메디룰, "FDA의 높은 벽, AI SaaS로 함께 넘겠습니다" [서울과기대 x 글로벌 뉴스] IT동아갤로그로 이동합니다. 12.08 12 0
6253 [정훈구의 인터'스페이스'] 광화문 거리를 수놓는 초대형 스크린, 끝내 이에 합류할 수 없는 한 기업... [5] IT동아갤로그로 이동합니다. 12.08 1288 2
6252 “AI로 금융 보이스피싱 범죄 예방ㆍ대응한다” 금융보안원, ASAP 플랫폼 구축 IT동아갤로그로 이동합니다. 12.05 790 1
6251 전남대학교 'GSS IR 데모데이' 개최, 창업나선 교수들 '눈길' IT동아갤로그로 이동합니다. 12.05 42 0
6250 韓 스타링크 시대 개막…일반 소비자도 사용 가능? IT동아갤로그로 이동합니다. 12.05 61 0
6249 [크립토퀵서치] 거래소 해킹으로 인한 피해를 줄이려면? IT동아갤로그로 이동합니다. 12.05 31 0
6248 [스타트업-ing] 메타모빌리티 “CES 혁신상 엘리케어, 전기차 인공지능 예측 안전 시대로” IT동아갤로그로 이동합니다. 12.05 35 0
6247 부품값 더 오르기 전에 맞추자··· 2025년형 인텔 CPU 기반 '200만 원대 견적' 짜보니 IT동아갤로그로 이동합니다. 12.05 104 0
6246 세종미래경제포럼 “인공지능 시대, 정보보호산업 진흥 클러스터·허브로” IT동아갤로그로 이동합니다. 12.05 31 0
6245 “버려진 자개장에서 새 가치를 찾다”…미지음디앤씨 [스타트업in과기대] IT동아갤로그로 이동합니다. 12.05 30 0
6244 현대건설 “스타트업과의 협업으로 공동주택 수목 관리 프로세스 고도화” IT동아갤로그로 이동합니다. 12.05 33 0
6243 [리뷰] 검증된 품질에 효율성까지, 넷기어 GS105v5 기가비트 스위치 IT동아갤로그로 이동합니다. 12.04 27 0
6242 [스타트업-ing] 숫자로 기후를 말하다…데이터 기반 기후영향 평가 돕는 ‘메타어스랩’ IT동아갤로그로 이동합니다. 12.04 37 0
6241 “투자자-스타트업 교류의 장” 서울과기대, 네트워킹 데이(서울 스타트업 얼라이언스 2025) 개최 IT동아갤로그로 이동합니다. 12.04 30 0
6240 [스타트업-ing] 그라운드원 "AI 기술로 건물 에너지 자율 운영…도시·국가로 확대할 것" IT동아갤로그로 이동합니다. 12.04 39 0
6239 [스타트업-ing] 크로스허브 김재설 대표, "아이디블록, 국경 없는 개인정보 인증을 위한 열쇠" IT동아갤로그로 이동합니다. 12.04 32 0
6238 한국임업진흥원 “오픈이노베이션, 자원순환·탄소중립 등 ESG 가치 확산” IT동아갤로그로 이동합니다. 12.04 29 0
6237 북아이피스 "교육콘텐츠 출처 식별 기술로 저작권 문제 해결" IT동아갤로그로 이동합니다. 12.04 26 0
6236 세이브트리 “산림분야 오픈이노베이션 통해 '트리맵 360' 확대 기대” IT동아갤로그로 이동합니다. 12.04 28 0
6235 “데이터 기반 농장 전력 절감 노하우” 레이닷, 현대건설과 아파트 스마트 조경 솔루션 개발 IT동아갤로그로 이동합니다. 12.04 33 0
6234 서울창조경제혁신센터 “해외 인재 인턴십 성과…함께 스타트업 세계화 매진” IT동아갤로그로 이동합니다. 12.04 1127 1
6233 [주간스타트업동향] 아크릴, IPO 기업 설명회 개최 外 IT동아갤로그로 이동합니다. 12.03 102 0
6232 전북창조경제혁신센터 “문화와 신산업 어우러진 데이터 창업 생태계로” [지역 창업생태계 리포트] IT동아갤로그로 이동합니다. 12.03 34 0
6231 [스타트업-ing] 윌로그, IoT·AI 기반 물류 시각화 시스템으로 글로벌 시장 정조준 IT동아갤로그로 이동합니다. 12.03 88 0
6230 유한킴벌리 “나무 심는 활동도 과학으로 증명…오픈이노베이션 성과” IT동아갤로그로 이동합니다. 12.03 37 0
6229 더 쉽고 간편히 즐기는 손바닥 안의 드론 ‘DJI 네오 2’ IT동아갤로그로 이동합니다. 12.02 52 0
6228 [위클리AI] 오픈AI·액센추어, 엔터프라이즈 AI 도입…협력 강화 IT동아갤로그로 이동합니다. 12.02 31 0
6227 [IT신상공개] 두 번 접는 스마트폰, 삼성 갤럭시 Z 트라이폴드 IT동아갤로그로 이동합니다. 12.02 92 0
6226 플랙티컬 "교사 동료 ‘왓퀴즈 AI’, 생기부 작성도 척척"[스타트업in과기대] IT동아갤로그로 이동합니다. 12.02 34 0
6225 [자동차와 法] 고령 운전자·보행자 시대 피해자 보호를 위한 방안 [2] IT동아갤로그로 이동합니다. 12.02 776 3
6224 "스마트코티지로 친환경 혁신할 것" LG전자, 산림청 손잡고 오픈이노베이션 추진 IT동아갤로그로 이동합니다. 12.02 41 0
6223 퓨어스토리지 "이젠 GPU 확보 넘어 AI 활용성 향상이 승부처" IT동아갤로그로 이동합니다. 12.02 89 0
6222 [스타트업을 위한 회계·세무] 스타트업 엑시트 시 고려해야 할 세금 관련 요건은? IT동아갤로그로 이동합니다. 12.02 43 0
6221 “SBA 지원 우수기업 성과를 한 자리에” 2025년 서울창업허브(2)투게더 IT동아갤로그로 이동합니다. 12.02 66 0
6220 [스타트업-ing] 레이븐머티리얼즈 “오염 정화하는 가시광촉매 ‘흑색산화티타늄’으로 신소재 유니콘 꿈꾼다” IT동아갤로그로 이동합니다. 12.02 37 0
6219 딥엑스, 피지컬AI 상용화 위해 현대차·기아 로보틱스랩과 맞손 IT동아갤로그로 이동합니다. 12.01 46 0
6218 [투자를IT다] 2025년 11월 4주차 IT기업 주요 소식과 시장 전망 IT동아갤로그로 이동합니다. 12.01 48 0
6217 퓨리오사AI-노타, NPU-AI 최적화 기술 협력... '국산 AI 반도체' 경쟁력 극대화 IT동아갤로그로 이동합니다. 12.01 64 0
6216 [신차공개] BMW ‘XM 레이블’ 출시·기아 ‘디 올 뉴 셀토스’ 티저 공개 IT동아갤로그로 이동합니다. 12.01 44 0
6215 [주간투자동향] 본, 170억 원 규모 시드 투자 유치 外 IT동아갤로그로 이동합니다. 12.01 50 0
6214 '공공재' 된 개인정보…무감각의 시대, 다크웹에선 장사 중 [11] IT동아갤로그로 이동합니다. 12.01 1702 6
6213 SBA, 커뮤니티 데이 성료…“중소기업과 소통·성장·동행 선순환 구축” IT동아갤로그로 이동합니다. 12.01 115 0
6212 [스타트업-ing] 망고슬래브 “AI 점자 프린터 네모닉 닷 CES 최고혁신상, 시각장애 벽 허물 것” IT동아갤로그로 이동합니다. 12.01 116 0
6211 축산업 탄소배출 규제 강화…기능성 사료로 대응 돕는 ‘가야바이오’ IT동아갤로그로 이동합니다. 11.28 41 0
6210 산업용 PC 1위 어드밴텍, 엣지 AI 혁신 위해 '에너자이'와 협력 IT동아갤로그로 이동합니다. 11.28 51 0
6209 [KIDP 울산] 전통 칠보 기업 남정, ‘K럭셔리’ 도약 위한 투자 유치 전략은? IT동아갤로그로 이동합니다. 11.28 43 0
6208 6G 전면에 AI 내세운 이통3사, 차세대 네트워크 청사진은? IT동아갤로그로 이동합니다. 11.28 87 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2