오픈AI(OpenAI)가 소형 모델 라인업을 대폭 강화했다. 코딩과 서브에이전트(Sub-agent) 작업에 최적화된 GPT-5.4 mini와 GPT-5.4 nano를 공식 출시하며 성능과 속도, 비용 효율성을 동시에 잡겠다는 전략을 내세웠다.
오픈AI에 따르면 두 모델은 지금까지 공개된 소형 모델 가운데 가장 높은 성능을 갖추고 있으며, GPT-5.4의 주요 강점을 유지하면서도 대규모 작업을 더 빠르고 효율적으로 처리하도록 설계됐다.
GPT-5.4 mini는 코딩, 추론, 멀티모달(Multimodal) 이해, 도구 사용 전반에서 GPT-5 mini보다 두 배 이상 빠른 속도로 향상된 성능을 제공한다. 소프트웨어 엔지니어링 능력을 측정하는 SWE-벤치(SWE-Bench) Pro와 컴퓨터 사용 능력 평가인 OSWorld-Verified를 포함한 주요 벤치마크에서도 상위 모델인 GPT-5.4에 근접한 수치를 기록했다.
GPT-5.4 nano는 속도와 비용이 최우선인 작업을 위해 설계된 가장 작고 저렴한 모델이다. GPT-5 nano 대비 성능이 크게 향상됐으며, 분류·데이터 추출·랭킹 작업과 비교적 단순한 보조 작업을 처리하는 코딩 서브에이전트에 적합하다는 설명이다.
두 모델은 응답 속도가 제품 경험에 직결되는 환경을 겨냥해 개발됐다. 빠른 반응이 필요한 코딩 어시스턴트(Coding Assistant), 보조 작업을 신속히 처리하는 서브에이전트, 스크린샷을 실시간으로 해석하는 컴퓨터 사용 시스템, 이미지를 즉각 분석하는 멀티모달 애플리케이션이 대표적인 활용 사례다. 오픈AI는 이러한 환경에서는 가장 큰 모델이 항상 최선이 아니라며, 빠르게 응답하고 도구를 안정적으로 활용하면서도 복잡한 전문 작업에서 높은 성능을 유지하는 모델이 더 적합한 경우가 많다고 강조했다.
주요 벤치마크 결과를 보면 SWE-벤치 Pro(공개)에서 GPT-5.4 mini는 54.4%를 기록해 GPT-5 mini(45.7%)를 크게 앞섰으며, GPT-5.4(57.7%)에도 근접했다. OSWorld-Verified에서는 GPT-5.4 mini가 72.1%로 GPT-5.4(75.0%)와 불과 2.9%포인트 차이에 불과했고, GPT-5 mini(42.0%)는 큰 격차로 따돌렸다. 범용 추론 능력을 측정하는 GPQA 다이아몬드(GPQA Diamond) 항목에서도 GPT-5.4 mini는 88.0%를 달성해 GPT-5 mini(81.6%)를 앞섰다.
서브에이전트 활용 측면에서도 GPT-5.4 mini는 두각을 나타낸다. 오픈AI의 코딩 플랫폼 코덱스(Codex)에서는 GPT-5.4 같은 대형 모델이 계획 수립과 최종 판단을 담당하고, 코드베이스 검색이나 대용량 파일 검토 같은 세부 하위 작업은 GPT-5.4 mini 서브에이전트가 병렬로 처리하도록 구성할 수 있다. 오픈AI는 소형 모델의 속도와 성능이 계속 향상되면서 대형 모델이 무엇을 할지 결정하고 소형 모델이 이를 빠르게 실행하는 시스템이 더욱 유용해질 것이라고 내다봤다.
실제 서비스 현장의 반응도 긍정적이다. 기업용 AI 검색 솔루션 헤비아(Hebbia)의 최고기술책임자(CTO) 아바스 샤르마(Aabhas Sharma)는 "GPT-5.4 mini는 이 등급의 모델 가운데서도 강력한 엔드투엔드(End-to-end) 성능을 보여준다"며 "내부 평가에서 여러 출력 작업과 인용 재현율에서 훨씬 낮은 비용으로 경쟁 모델과 비슷하거나 더 높은 성능을 달성했고, 더 큰 모델인 GPT-5.4보다 엔드투엔드 통과율과 출처 귀속 정확성도 더 뛰어났다"고 밝혔다.
이용 범위와 가격도 공개됐다. GPT-5.4 mini는 API(Application Programming Interface), 코덱스, 챗GPT(ChatGPT)에서 즉시 사용 가능하다. API를 통해 텍스트와 이미지 입력, 도구 사용, 함수 호출, 웹 검색, 파일 검색, 컴퓨터 사용 기능을 제공하며 컨텍스트 윈도우(Context Window)는 40만 토큰이다. 가격은 입력 토큰 100만 개당 0.75달러, 출력 토큰 100만 개당 4.50달러다.
코덱스에서는 GPT-5.4 mini가 GPT-5.4 사용 한도의 30%만 소비하기 때문에 비교적 단순한 코딩 작업을 약 3분의 1 수준의 비용으로 처리할 수 있다. 챗GPT에서는 Free 및 Go 플랜 사용자가 '잘 생각하기' 옵션으로 이용 가능하며, 그 외 사용자에게는 GPT-5.4 Thinking의 사용 한도 도달 시 대체 모델로 제공된다.
GPT-5.4 nano는 API에서만 사용할 수 있으며 가격은 입력 토큰 100만 개당 0.20달러, 출력 토큰 100만 개당 1.25달러다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.