디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

AI 경량화 경쟁, 1.58비트 '극단적 양자화'로 세계 무대 선 에너자이의 약진

IT동아갤로그로 이동합니다. 2025.12.10 14:02:21
조회 1662 추천 3 댓글 10
[IT동아 남시현 기자] 딥러닝, AI 분야에서 양자화(Quantization)란 모델의 가중치와 활성화를 32비트 부동소수점(FP32) 같은 높은 정밀도에서 8비트 정수(INT8) 같은 낮은 정밀도로 변환하는 과정이다. 예를 들어 FP32 기반이 도로나 건물 주소까지 모두 기재된 정밀한 지도라면 INT8은 주요 건물과 큰 도로만 그려진 지도다. INT8 지도는 가볍고 작아서 휴대하기 좋고, 길을 찾는데도 훨씬 빠르다. 당연히 세세한 정보까지 찾기는 어렵지만 목적지에 도착하는 데는 큰 문제가 없다. AI 모델 양자화도 비슷한 원리다.

AI 모델을 양자화하면 동작에 필요한 연산량이 줄어들고 동작 속도도 빨라진다. 모델이 차지하는 저장공간과 메모리 사용량도 줄어들어 에너지 효율성도 향상된다. 필연적으로 정확도가 줄어들지만 최대한 손실을 줄이는 것이 AI 양자화 기술기업의 경쟁력이며, 갈수록 경쟁은 첨예해지고 있다. 초기에는 16비트나 8비트 양자화로 시작했으나, 최근에는 2비트 이하의 극단적 양자화도 등장하기 시작했다.


AI 모델 양자화는 모델의 용량과 메모리 사용량은 줄이고, 정밀도는 최대한 유지하는 기술이다 / 출처=에너자이



마이크로소프트는 올해 4월 1.58비트의 극단적 양자화가 반영된 비트넷 b1.58 2B4T 모델을 선보였다. 엔비디아는 AI 양자화 기술 기업인 데시(Deci), 옴니ML를 인수하며 시장 지원에 나서고 있으며, 아마존은 퍼시브(Perceive), 레드햇은 뉴럴 매직(Neural Magic)을 각각 인수해 양자화 생태계를 확보 중이다. 모델 양자화와 밀접한 관련이 있는 Arm과 퀄컴, 미디어텍 등 소형 기기용 반도체 제조사들도 기술 지원 및 생태계 확장에 공을 들이고 있다.

흥미로운 점은 소수의 빅테크 기업이 생태계를 독식하지 않고 다양한 기술 스타트업들이 함께 생태계를 만들고 있다. AI 적용 분야가 워낙 넓고 기업마다 적용 대상 등이 다른 덕분이다. 우리나라에서는 에너자이, 스퀴즈비츠, 노타, 클리카 등의 스타트업이 AI 모델 양자화 분야를 섭렵 중이다. 각각의 기업들이 괄목할만한 성장을 이루고 있는데, 에너자이의 사례를 통해 AI 모델 양자화 기업의 행보를 살펴본다.

1.58비트 양자화로 세계 시장 공략 나선 에너자이



에너자이의 양자화 기술과 AI 추론 엔진 옵티미엄으로 다양한 AI 모델을 극저비트로 양자화할 수 있다 / 출처=에너자이



에너자이는 AI 모델의 정확도 손실을 최소화하며 극저비트로 양자화하는 기술과 자체 개발한 AI 추론 최적화 엔진 ‘옵티미엄(Optimium)’을 기반으로 AI 양자화 시장에 도전 중이다. 옵티미엄은 1.58비트 커널을 유연하게 생성할 수 있어 1.58비트의 극저비트 정밀도(extreme low-bit precision) 모델도 지원한다. 이 기술을 활용했을 때 오픈AI의 음성인식 모델 ‘위스퍼 스몰’ 모델을 기존 대비 정확도 손실은 0.39% 미만으로 최소화하면서 속도는 2.46배 향상시키고, 엣지 환경에서 음성 및 언어 AI 모델 구동 시 주요 병목이 되는 메모리 사용량을 77.3% 절감하는 결과를 발휘했다.


에너자이는 올해 9월 12일에서 15일 사이 암스테르담 IBC(nternational Broadcasting Convention)의 시냅틱스 부스에 참가, 온디바이스 AI로 구현되는 실시간 음성 자막 번역 기술을 소개했다 / 출처=IT동아



에너자이는 지난 10월 15일 미국 캘리포니아 주 세너제이에서 열린 시냅틱스 테크 데이에 참가해 시냅틱스 고객사 및 파트너사를 대상으로 시냅틱스 SL1680 임베디드 IoT(사물인터넷) SoC(시스템 온 칩)에 1.58비트 AI 모델을 시연했다. 해당 기기는 소비자 가전, 산업 제어 시스템, 디지털 사이니지, 홈 시큐리티 게이트 웨이 등 저전력 기기에 주로 활용된다. 해당 기기 비교적 저사양 기기에서 서버연결 없이 자체적으로 고성능 음성 및 언어 AI 모델을 구동했다는 게 핵심이다.


장한힘 대표가 임베디드 월드 노스 아메리카(embedded world North America)에서 글로벌 반도체 기업인 ST마이크로일렉트로닉스, 마이크로칩과 함께 발표를 진행 중이다 / 출처=IT동아



아울러 산업용 에이전트 AI 플랫폼을 운영하는 미국 이터레이트.AI(Iterate.ai)가 주최한 AI 심포지엄에 패널로 참여했고, 과기정통부가 주관하고 뉴욕대학교 스턴경영대학원, 정보통신산업진흥원(NIPA), 한국소프트웨어산업협회(KOSA)가 공동 운영하는 현지화 AI 엑셀러레이팅 프로그램(AIIA)을 이수해 현지 시장 전략 고도화 및 투자자 네트워킹 등 미국 동부 시장 진출을 위한 발판도 마련했다. 또 미국의 IT 매체인 테크크런치(TechCrunch)가 주최한 ‘K-이노베이터 피치 나이트’와 ‘코리안 파운더스 밋업 인 스탠퍼드’ 행사에서 에너자이의 기술력을 소개하기도 했다.

11월에는 미국 캘리포니아 주 애너하임에서 개최되는 임베디드 월드 노스 아메리카(embedded world North America)에 부스를 마련했고, 초효율적인 임베디드 AI 추론을 위한 극단적 양자화 기술(Extreme Quantization Techniques for Ultra-efficient Embedded AI Inference)을 주제로 발표했다.

한국 넘어 아시아 시장에서도 주요 플레이어로 성장해


우리나라를 비롯한 아시아 시장에서도 활동 범위를 넓히고 있다. 에너자이는 지난 2022년 Arm Ai 파트너 프로그램에 선정돼 협력 관계에 있으며, 지난 10월에는 국내외 Arm 관련 파트너사가 참여하는 Arm 언락드 코리아 2025에서 ‘다양한 Arm 에코시스템 전반에서 온디바이스 AI의 확장’을 주제로 패널 토크에 참여했다. 11월에는 대만을 찾아 사물인터넷 분야 협회인 ‘엣지 AI 파운데이션’이 주최한 행사에서 어드밴텍(Advantech)과 함께 ‘엣지 AI 최적화: 경량 모델 및 확장 가능한 아키텍처(Optimizing Edge AI: Lightweight Models and Scalable Architecture)’를 주제로 워크숍을 진행했다.


장한힘 에너자이 대표가 엣지 AI 파운데이션 주최 행사에서 발표를 질의응답을 진행 중이다 / 출처=에너자이



패널토크에서는 퀄컴, 르네사스, 어드밴텍과 함께 ‘응용 엣지 AI-엣지 AI 배포 및 조율부터 확장 가능한 설루션(Applied Edge AI - Orchestrating Edge AI: From Silicon to Scalable Solutions)을 주제로 논의를 나눴다. 행사 이후 어드밴텍의 소프트웨어 개발 환경 및 운영 시스템인 WEDA와 관련해 엣지 AI 설루션 개발 및 배포 분야에서 협력하는 내용의 양해각서를 체결했다.

한편 에너자이는 2026년 1월 6일부터 9일까지 미국 네바다 주 라스베이거스에서 개최되는 소비자 가전 전시회(CES 2026)의 'K-스타트업 통합관’에도 참가해 Arm 기반 엣지용 SoC에서 에너자이의 극저비트 기술을 적용한 음성 기반 실시간 명령 제어 모델과, 실시간 자막 생성 및 번역을 수행하는 모델을 각각 선보일 예정이다.

쌓이기 시작한 도입 사례, 2026년이 더욱 기대되는 AI 모델 양자화 업계



AI 모델 양자화로 모델 크기를 줄인 덕분에 셋톱박스에서도 음성 명령 AI를 쓸 수 있게 됐다 / 출처=LG유플러스



에너자이는 글로벌 시장에서 협력 구도를 마련하고 기술을 소개하면서도 꾸준히 사업화를 추진 중이다. 앞서 해외 출장 기간 중에는 에너자이가 양자화한 음성 및 언어 AI 모델이 LG유플러스의 IP TV용 셋톱박스 200만 대에 상용 배포되기도 했다. AI를 도입하는 기업들이 많아질수록 AI 모델 양자화 기술을 찾는 수요도 자연스레 늘어날 상황이다.

기사를 통해서는 에너자이 한 곳의 사례만 들었지만, 이미 모든 국내외 AI 양자화 기업들이 각자의 분야에서 수많은 러브콜과 기술 협력을 요청받는 상황이다. 당연하지만 극단적 양자화 기술의 발전은 곧 일상에서 사용하는 다양한 기기에서 더 고도화된 AI를 누리고, 더 나아가 우리 일상 곳곳에서 AI를 활용할 수 있는 기술적 해답이기 때문이다. 오는 2026년은 우리나라가 AI 모델 양자화 기술 종주국으로 인정받는 해가 될 것으로 보인다.

IT동아 남시현 기자 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 부품값 더 오르기 전에 맞추자··· 2025년형 인텔 CPU 기반 '200만 원대 견적' 짜보니▶ 산업용 PC 1위 어드밴텍, 엣지 AI 혁신 위해 '에너자이'와 협력▶ 6G 전면에 AI 내세운 이통3사, 차세대 네트워크 청사진은?



추천 비추천

3

고정닉 0

6

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 내 돈 관리 맡기고 싶은 재태크 고수 같은 스타는? 운영자 26/01/12 - -
6487 엔비디아 DLSS 4.5 “2세대 트랜스포머 모델로 게임 그래픽 가속” [10] IT동아갤로그로 이동합니다. 01.17 1078 1
6486 “물 들어올 때 노 젓자” 금융당국, 외환ㆍ자본시장 혁신 나선다 IT동아갤로그로 이동합니다. 01.16 38 0
6485 AI 열풍에 ‘금값’ 된 PC 부품, 기다림만이 답은 아니다 IT동아갤로그로 이동합니다. 01.16 118 0
6484 서울지하철, 신형 교통카드 키오스크 설치…17년 만에 무엇이 바뀌었나 [7] IT동아갤로그로 이동합니다. 01.16 1740 4
6483 [IT하는법] 스마트폰 모바일 데이터 사용량을 제한하려면? IT동아갤로그로 이동합니다. 01.16 79 0
6482 생성형을 넘어 에이전트로…공공 행정 분야 AI 2.0 전환 박차 IT동아갤로그로 이동합니다. 01.16 32 0
6481 연이은 보안 사고, 사이버보험 도움될까…통신사 보안 서비스는? IT동아갤로그로 이동합니다. 01.16 1004 0
6480 [스타트업리뷰] 기업 채용 업무 효율성 높이는 세컨드팀 ‘AI면접관’ IT동아갤로그로 이동합니다. 01.16 20 0
6479 [써니모모의 '육십 먹고 생성AI'] 3. 디카/스마트폰 사진으로 애니메이션 만들기 IT동아갤로그로 이동합니다. 01.15 31 0
6478 [시승기] 전기차 시장에 등장한 또 하나의 선택지…'기아 EV4' IT동아갤로그로 이동합니다. 01.15 29 0
6477 [경북대 X IT동아] 네오덱스 "개구기에서 의료 AI까지, 치의학계의 '퍼스트 무버' 될 것" IT동아갤로그로 이동합니다. 01.15 130 0
6476 칩셋, 카메라, 가격...내달 발표 갤럭시 S26의 '3대 변수' [21] IT동아갤로그로 이동합니다. 01.15 1382 54
6475 전통금융권과 손잡는 디지털자산 거래소, 2026년 지각 변동 예고 IT동아갤로그로 이동합니다. 01.15 34 0
6474 운전면허 벌점으로 정지·취소까지···KB국민은행·티맵서 확인하는 법 IT동아갤로그로 이동합니다. 01.15 35 0
6473 1월 22일 시행 예정되는 ‘AI 기본법’, 기업들은 준비됐나 [3] IT동아갤로그로 이동합니다. 01.15 598 2
6472 “미국 우선주의” 트럼프 미디어가 발행한 ETF는 특별한가? IT동아갤로그로 이동합니다. 01.14 49 0
6471 [주간스타트업동향] 딥인사이트, CES 2026서 '디멘뷰' 전시 성료 外 IT동아갤로그로 이동합니다. 01.14 110 0
6470 '오픈인프라서밋'으로 확인한 카카오클라우드의 고가용성·이중화 전략 IT동아갤로그로 이동합니다. 01.14 38 0
6469 소서릭스 AI 홈 오토메이션 SOL, CES 혁신상 수상 [SBA CES] IT동아갤로그로 이동합니다. 01.14 34 0
6468 "개선된 챗봇으로 맞춤 상담" 따릉이 앱, 어떻게 달라졌나 [2] IT동아갤로그로 이동합니다. 01.14 566 1
6467 [경북대 X IT동아] 노코드 AI 한계 넘어 앱·웹 생성부터 운영까지 자동화…‘엠바스’ IT동아갤로그로 이동합니다. 01.14 89 0
6466 “가상이 아닌 현실” 피지컬 AI 시대 알린 CES 2026 IT동아갤로그로 이동합니다. 01.13 49 0
6465 [위클리AI] 구글, 애플·월마트 손잡았다···글로벌 영향력 확대 IT동아갤로그로 이동합니다. 01.13 41 0
6464 [자동차와 法] 새해 교통안전 관련 제도 무엇이 달라지나 IT동아갤로그로 이동합니다. 01.13 39 0
6463 ‘해킹 맛집’ 오명 쓴 대한민국, 2026년 AI 보안 과제는 IT동아갤로그로 이동합니다. 01.13 215 0
6462 한국에서 태어나 세계로 향한다…르노코리아 크로스오버 ‘필랑트’ 데뷔 IT동아갤로그로 이동합니다. 01.13 636 0
6461 정부 '2026 경제성장전략' 발표···디지털자산 제도권 진입 본격화 IT동아갤로그로 이동합니다. 01.13 40 0
6460 [생활 속 IT] 병원마다 다른 비급여 진료비, 한눈에 비교하기 IT동아갤로그로 이동합니다. 01.13 1358 4
6459 [K-스페이스 퀀텀 점프] 1. 우주항공청의 리모델링이 필요하다 IT동아갤로그로 이동합니다. 01.13 38 0
6458 [투자를IT다] 2026년 1월 2주차 IT기업 주요 소식과 시장 전망 IT동아갤로그로 이동합니다. 01.12 48 0
6457 [신차공개] 현대차 '더 뉴 스타리아 EV'·기아 '더 기아 EV2' 최초 공개 IT동아갤로그로 이동합니다. 01.12 67 0
6456 [뉴스줌인] 롤러형 물걸레 단 로보락의 신형 로봇청소기, 뭐가 다르지? IT동아갤로그로 이동합니다. 01.12 66 0
6455 [주간투자동향] 라이드플럭스, 200억 원 규모 프리 IPO 투자 유치 外 IT동아갤로그로 이동합니다. 01.12 587 1
6454 [리뷰] “휴대용 지포스 RTX 5070 Ti” 에이수스 ROG XG 모바일 GC34R-034 IT동아갤로그로 이동합니다. 01.09 68 0
6453 2026년 새로운 청년 혜택, 무엇이 있을까? IT동아갤로그로 이동합니다. 01.09 56 0
6452 새해 달라지는 교통 관련 제도 살펴보니 IT동아갤로그로 이동합니다. 01.09 926 2
6451 [CES 2026] CES 2026에서 주목받은 오디오 기기는? IT동아갤로그로 이동합니다. 01.09 36 0
6450 그린리본, CES 2026서 환자 중심 임상 리크루팅 플랫폼 ‘그린스카우트’ 성과 공개 [SBA CES] IT동아갤로그로 이동합니다. 01.09 39 0
6449 가상자산 거래소 과태료 처분, 법령준수 역량 강화 필요 IT동아갤로그로 이동합니다. 01.09 110 0
6448 PC 부품값 폭등 시대, 클라우드 PC가 해법 될까? [12] IT동아갤로그로 이동합니다. 01.09 827 1
6447 [CES 2026] 로닉, 피지컬 AI 기반 AI 디스펜서 기술로 글로벌 F&B기업에 ‘눈도장’ IT동아갤로그로 이동합니다. 01.09 91 0
6446 SBA "CES 글로벌 이노베이션 포럼, 세계 창업계 이목 집중" [SBA CES] IT동아갤로그로 이동합니다. 01.09 43 0
6445 [CES 2026] 전장 기업, 부품 공급자에서 미래차 생태계 핵심 플레이어로 부상 IT동아갤로그로 이동합니다. 01.08 58 0
6444 [스타트업-ing] 그랜터 "AI 재무 데이터로 스타트업 금융 문턱 낮춘다" IT동아갤로그로 이동합니다. 01.08 42 0
6443 [CES 2026] AI로 혁신성 더한 국내 CES 2026 참가 스타트업은? IT동아갤로그로 이동합니다. 01.08 326 1
6442 CARF 시행, 해외 가상자산 거래 정보 자동 공유 IT동아갤로그로 이동합니다. 01.08 76 0
6441 KTX–SRT 10년 만에 통합, 무엇이 달라지나 IT동아갤로그로 이동합니다. 01.08 75 0
6440 [CES 2026] 피지컬 AI에 방점 찍은 완성차 업체…어떤 기술 선보였나 IT동아갤로그로 이동합니다. 01.07 41 0
6439 “금융 사각지대 해소에 초점” 2026년 달라지는 금융정책 [3] IT동아갤로그로 이동합니다. 01.07 451 1
6438 [CES 2026] AMD, CES 2026서 MI455X·MI500 공개··· '요타플롭스 시대 위한 인프라 기업 될 것' IT동아갤로그로 이동합니다. 01.07 46 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2