디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

AI 경량화 경쟁, 1.58비트 '극단적 양자화'로 세계 무대 선 에너자이의 약진

IT동아갤로그로 이동합니다. 2025.12.10 14:02:21
조회 1683 추천 3 댓글 10
[IT동아 남시현 기자] 딥러닝, AI 분야에서 양자화(Quantization)란 모델의 가중치와 활성화를 32비트 부동소수점(FP32) 같은 높은 정밀도에서 8비트 정수(INT8) 같은 낮은 정밀도로 변환하는 과정이다. 예를 들어 FP32 기반이 도로나 건물 주소까지 모두 기재된 정밀한 지도라면 INT8은 주요 건물과 큰 도로만 그려진 지도다. INT8 지도는 가볍고 작아서 휴대하기 좋고, 길을 찾는데도 훨씬 빠르다. 당연히 세세한 정보까지 찾기는 어렵지만 목적지에 도착하는 데는 큰 문제가 없다. AI 모델 양자화도 비슷한 원리다.

AI 모델을 양자화하면 동작에 필요한 연산량이 줄어들고 동작 속도도 빨라진다. 모델이 차지하는 저장공간과 메모리 사용량도 줄어들어 에너지 효율성도 향상된다. 필연적으로 정확도가 줄어들지만 최대한 손실을 줄이는 것이 AI 양자화 기술기업의 경쟁력이며, 갈수록 경쟁은 첨예해지고 있다. 초기에는 16비트나 8비트 양자화로 시작했으나, 최근에는 2비트 이하의 극단적 양자화도 등장하기 시작했다.


AI 모델 양자화는 모델의 용량과 메모리 사용량은 줄이고, 정밀도는 최대한 유지하는 기술이다 / 출처=에너자이



마이크로소프트는 올해 4월 1.58비트의 극단적 양자화가 반영된 비트넷 b1.58 2B4T 모델을 선보였다. 엔비디아는 AI 양자화 기술 기업인 데시(Deci), 옴니ML를 인수하며 시장 지원에 나서고 있으며, 아마존은 퍼시브(Perceive), 레드햇은 뉴럴 매직(Neural Magic)을 각각 인수해 양자화 생태계를 확보 중이다. 모델 양자화와 밀접한 관련이 있는 Arm과 퀄컴, 미디어텍 등 소형 기기용 반도체 제조사들도 기술 지원 및 생태계 확장에 공을 들이고 있다.

흥미로운 점은 소수의 빅테크 기업이 생태계를 독식하지 않고 다양한 기술 스타트업들이 함께 생태계를 만들고 있다. AI 적용 분야가 워낙 넓고 기업마다 적용 대상 등이 다른 덕분이다. 우리나라에서는 에너자이, 스퀴즈비츠, 노타, 클리카 등의 스타트업이 AI 모델 양자화 분야를 섭렵 중이다. 각각의 기업들이 괄목할만한 성장을 이루고 있는데, 에너자이의 사례를 통해 AI 모델 양자화 기업의 행보를 살펴본다.

1.58비트 양자화로 세계 시장 공략 나선 에너자이



에너자이의 양자화 기술과 AI 추론 엔진 옵티미엄으로 다양한 AI 모델을 극저비트로 양자화할 수 있다 / 출처=에너자이



에너자이는 AI 모델의 정확도 손실을 최소화하며 극저비트로 양자화하는 기술과 자체 개발한 AI 추론 최적화 엔진 ‘옵티미엄(Optimium)’을 기반으로 AI 양자화 시장에 도전 중이다. 옵티미엄은 1.58비트 커널을 유연하게 생성할 수 있어 1.58비트의 극저비트 정밀도(extreme low-bit precision) 모델도 지원한다. 이 기술을 활용했을 때 오픈AI의 음성인식 모델 ‘위스퍼 스몰’ 모델을 기존 대비 정확도 손실은 0.39% 미만으로 최소화하면서 속도는 2.46배 향상시키고, 엣지 환경에서 음성 및 언어 AI 모델 구동 시 주요 병목이 되는 메모리 사용량을 77.3% 절감하는 결과를 발휘했다.


에너자이는 올해 9월 12일에서 15일 사이 암스테르담 IBC(nternational Broadcasting Convention)의 시냅틱스 부스에 참가, 온디바이스 AI로 구현되는 실시간 음성 자막 번역 기술을 소개했다 / 출처=IT동아



에너자이는 지난 10월 15일 미국 캘리포니아 주 세너제이에서 열린 시냅틱스 테크 데이에 참가해 시냅틱스 고객사 및 파트너사를 대상으로 시냅틱스 SL1680 임베디드 IoT(사물인터넷) SoC(시스템 온 칩)에 1.58비트 AI 모델을 시연했다. 해당 기기는 소비자 가전, 산업 제어 시스템, 디지털 사이니지, 홈 시큐리티 게이트 웨이 등 저전력 기기에 주로 활용된다. 해당 기기 비교적 저사양 기기에서 서버연결 없이 자체적으로 고성능 음성 및 언어 AI 모델을 구동했다는 게 핵심이다.


장한힘 대표가 임베디드 월드 노스 아메리카(embedded world North America)에서 글로벌 반도체 기업인 ST마이크로일렉트로닉스, 마이크로칩과 함께 발표를 진행 중이다 / 출처=IT동아



아울러 산업용 에이전트 AI 플랫폼을 운영하는 미국 이터레이트.AI(Iterate.ai)가 주최한 AI 심포지엄에 패널로 참여했고, 과기정통부가 주관하고 뉴욕대학교 스턴경영대학원, 정보통신산업진흥원(NIPA), 한국소프트웨어산업협회(KOSA)가 공동 운영하는 현지화 AI 엑셀러레이팅 프로그램(AIIA)을 이수해 현지 시장 전략 고도화 및 투자자 네트워킹 등 미국 동부 시장 진출을 위한 발판도 마련했다. 또 미국의 IT 매체인 테크크런치(TechCrunch)가 주최한 ‘K-이노베이터 피치 나이트’와 ‘코리안 파운더스 밋업 인 스탠퍼드’ 행사에서 에너자이의 기술력을 소개하기도 했다.

11월에는 미국 캘리포니아 주 애너하임에서 개최되는 임베디드 월드 노스 아메리카(embedded world North America)에 부스를 마련했고, 초효율적인 임베디드 AI 추론을 위한 극단적 양자화 기술(Extreme Quantization Techniques for Ultra-efficient Embedded AI Inference)을 주제로 발표했다.

한국 넘어 아시아 시장에서도 주요 플레이어로 성장해


우리나라를 비롯한 아시아 시장에서도 활동 범위를 넓히고 있다. 에너자이는 지난 2022년 Arm Ai 파트너 프로그램에 선정돼 협력 관계에 있으며, 지난 10월에는 국내외 Arm 관련 파트너사가 참여하는 Arm 언락드 코리아 2025에서 ‘다양한 Arm 에코시스템 전반에서 온디바이스 AI의 확장’을 주제로 패널 토크에 참여했다. 11월에는 대만을 찾아 사물인터넷 분야 협회인 ‘엣지 AI 파운데이션’이 주최한 행사에서 어드밴텍(Advantech)과 함께 ‘엣지 AI 최적화: 경량 모델 및 확장 가능한 아키텍처(Optimizing Edge AI: Lightweight Models and Scalable Architecture)’를 주제로 워크숍을 진행했다.


장한힘 에너자이 대표가 엣지 AI 파운데이션 주최 행사에서 발표를 질의응답을 진행 중이다 / 출처=에너자이



패널토크에서는 퀄컴, 르네사스, 어드밴텍과 함께 ‘응용 엣지 AI-엣지 AI 배포 및 조율부터 확장 가능한 설루션(Applied Edge AI - Orchestrating Edge AI: From Silicon to Scalable Solutions)을 주제로 논의를 나눴다. 행사 이후 어드밴텍의 소프트웨어 개발 환경 및 운영 시스템인 WEDA와 관련해 엣지 AI 설루션 개발 및 배포 분야에서 협력하는 내용의 양해각서를 체결했다.

한편 에너자이는 2026년 1월 6일부터 9일까지 미국 네바다 주 라스베이거스에서 개최되는 소비자 가전 전시회(CES 2026)의 'K-스타트업 통합관’에도 참가해 Arm 기반 엣지용 SoC에서 에너자이의 극저비트 기술을 적용한 음성 기반 실시간 명령 제어 모델과, 실시간 자막 생성 및 번역을 수행하는 모델을 각각 선보일 예정이다.

쌓이기 시작한 도입 사례, 2026년이 더욱 기대되는 AI 모델 양자화 업계



AI 모델 양자화로 모델 크기를 줄인 덕분에 셋톱박스에서도 음성 명령 AI를 쓸 수 있게 됐다 / 출처=LG유플러스



에너자이는 글로벌 시장에서 협력 구도를 마련하고 기술을 소개하면서도 꾸준히 사업화를 추진 중이다. 앞서 해외 출장 기간 중에는 에너자이가 양자화한 음성 및 언어 AI 모델이 LG유플러스의 IP TV용 셋톱박스 200만 대에 상용 배포되기도 했다. AI를 도입하는 기업들이 많아질수록 AI 모델 양자화 기술을 찾는 수요도 자연스레 늘어날 상황이다.

기사를 통해서는 에너자이 한 곳의 사례만 들었지만, 이미 모든 국내외 AI 양자화 기업들이 각자의 분야에서 수많은 러브콜과 기술 협력을 요청받는 상황이다. 당연하지만 극단적 양자화 기술의 발전은 곧 일상에서 사용하는 다양한 기기에서 더 고도화된 AI를 누리고, 더 나아가 우리 일상 곳곳에서 AI를 활용할 수 있는 기술적 해답이기 때문이다. 오는 2026년은 우리나라가 AI 모델 양자화 기술 종주국으로 인정받는 해가 될 것으로 보인다.

IT동아 남시현 기자 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 부품값 더 오르기 전에 맞추자··· 2025년형 인텔 CPU 기반 '200만 원대 견적' 짜보니▶ 산업용 PC 1위 어드밴텍, 엣지 AI 혁신 위해 '에너자이'와 협력▶ 6G 전면에 AI 내세운 이통3사, 차세대 네트워크 청사진은?



추천 비추천

3

고정닉 0

6

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 내 돈 투자하고 싶게 만드는 CEO상 스타는? 운영자 26/03/02 - -
6699 [정석희의 기후 에너지 인사이트] 5. 기후테크, ‘본질’로 승부하라 IT동아갤로그로 이동합니다. 15:45 5 0
6698 [주간투자동향] 보스반도체, 870억 원 규모 시리즈A 투자 유치 外 IT동아갤로그로 이동합니다. 15:39 4 0
6697 MWC 2026, 이통3사 AI 전면전 막 올랐다 IT동아갤로그로 이동합니다. 15:32 4 0
6696 [리뷰] ‘꽉 찬 육각형’ 크리에이터 노트북, 에이수스 프로아트 PX13(HN7306) IT동아갤로그로 이동합니다. 02.28 39 0
6695 설치도, 복잡한 인프라도 필요 없다… 웹 브라우저 하나로 확대되는 ‘AI·코딩 교육’ [4] IT동아갤로그로 이동합니다. 02.27 1732 3
6694 대전창조경제혁신센터, 수도권 VC-지역 스타트업 잇는 '지역 순회 벤처투자 설명회' 개최 IT동아갤로그로 이동합니다. 02.27 29 0
6693 와이앤아처, AC+VC+PE 통합한 '와인앤아처그룹' 출범... 창업 전주기 투자 모델 가동 IT동아갤로그로 이동합니다. 02.27 31 0
6692 저스트핀 CTO "2인 체제로 블루미 출시···현실감 있는 대화에 집중" IT동아갤로그로 이동합니다. 02.27 34 0
6691 말 한 마디로 만드는 나만의 곡, 구글 음악 생성 AI ‘리리아 3’ 써보니 IT동아갤로그로 이동합니다. 02.27 44 0
6690 'HP 3D 프린터 한 대로 드론 연 2만 대 생산'··· UAV 제조 최선단에 있는 HP IT동아갤로그로 이동합니다. 02.27 38 0
6689 파네시아 정명수 대표 "UA·NV링크 아우르는 인터커넥트 주권 확보할 것" IT동아갤로그로 이동합니다. 02.27 32 0
6688 [스타트업-ing] 타이디비 “소상공인·스타트업 위한 AI 올인원 브랜딩 솔루션, 요비" IT동아갤로그로 이동합니다. 02.27 36 0
6687 [황성진의 '고대 사상가, AI를 만나다'] 마키아벨리가 AI를 쓴다면 가장 먼저 잘라냈을 변명 세 가지 IT동아갤로그로 이동합니다. 02.27 35 0
6686 [정훈구의 인터'스페이스'] 136명이 성수동에 도착하는 방법 IT동아갤로그로 이동합니다. 02.27 349 2
6685 스테이블코인·거래소 지분 규제 “시장 안정과 무관, 재검토 필요” IT동아갤로그로 이동합니다. 02.27 38 0
6684 갤럭시 S26 시리즈, '스펙' 보다 'AI 경험' 더 앞세웠다 IT동아갤로그로 이동합니다. 02.26 244 0
6683 “공공 AI 전환의 현실과 가능성을 논하다” 애자일 AI 정부 세미나 IT동아갤로그로 이동합니다. 02.26 34 0
6682 [생활 속 IT] "이제 스마트폰으로 로또 산다" 동행복권, 20년 만에 달라진 이유 IT동아갤로그로 이동합니다. 02.26 62 0
6681 엑스디노드 "부담스러운 GPU 서버 대신 초소형 NPU 서버로 AI 혁신 가능" [과기대 딥테크] IT동아갤로그로 이동합니다. 02.26 43 1
6680 처치 곤란했던 폐가전, 스티커 없이 무료 배출하는 방법 IT동아갤로그로 이동합니다. 02.26 336 0
6679 디지털 네이티브를 넘어 'AI 네이티브'로··· 렛서 심규현 대표가 말하는 AX의 본질 IT동아갤로그로 이동합니다. 02.26 36 0
6678 [IT신상공개] 고음질·AI 편의 기능 강화, 삼성전자 갤럭시 버즈4 시리즈 IT동아갤로그로 이동합니다. 02.26 71 0
6677 가람봇 “AI 기반 스마트 축사 관리 플랫폼으로 축산업 탄소중립 실현할 것” [2025 고려대 초창패] IT동아갤로그로 이동합니다. 02.25 48 0
6676 어드바이저로렌 “온프레미스 기반 AI 에이전트로 공공ㆍ국방ㆍ금융의 AI 전환 이끌 것” [2025 고려대 초창패] IT동아갤로그로 이동합니다. 02.25 57 0
6675 [르포] 네덜란드 도심 한복판에 들어선 ‘암스테르담 지커 센터’를 가다 IT동아갤로그로 이동합니다. 02.25 47 0
6674 [주간스타트업동향] 플로우, 프로젝트 설계하는 AI 에이전트 선보여 外 IT동아갤로그로 이동합니다. 02.25 43 0
6673 에릭슨, AI 시대 네트워크 전략 공개…“5G SA는 이미 답…수익화가 숙제” [1] IT동아갤로그로 이동합니다. 02.25 378 1
6672 서울과학기술대기술지주, '2026 창업포럼 ST-BOOST UP 세미나' 개최 IT동아갤로그로 이동합니다. 02.25 41 1
6671 '무조건 클라우드'는 옛말… 통제권 되찾는 ‘클라우드 송환’ 뜬다 [1] IT동아갤로그로 이동합니다. 02.25 472 4
6670 뉴메리얼 “대시옵티로 세계 제조업에 인공지능 바람” [고려대 초창패 2025] IT동아갤로그로 이동합니다. 02.25 42 0
6669 [스타트업 브랜딩 가이드] 브랜드 이름은 ‘검색’과 ‘기억’의 시작이다 IT동아갤로그로 이동합니다. 02.25 61 0
6668 '계란은 한 바구니에 담지 않는다'··· 메타, AMD와 6GW 인프라 계약 배경은? IT동아갤로그로 이동합니다. 02.25 49 0
6667 "필요한 곳에 기술 닿는 세상 만들 것" 피플즈, AI 교육으로 사회적 가치 창출 기대 [과기대 딥테크] IT동아갤로그로 이동합니다. 02.25 74 0
6666 디지털 사각지대 ‘낚시 시장’의 거래 표준 인프라 구축…'어바웃피싱' [경북대 X IT동아] IT동아갤로그로 이동합니다. 02.25 43 0
6665 [위클리AI] 앤스로픽·구글 연달아 새 모델 출시···엔비디아·메타 다시 손잡았다 IT동아갤로그로 이동합니다. 02.24 46 0
6664 [주간보안동향] 명품 브랜드 3곳, SaaS 해킹으로 개인정보 유출 사고 外 [1] IT동아갤로그로 이동합니다. 02.24 397 1
6663 보이스매치 “인공지능 맥신, 누구나 음악의 즐거움 누리도록” [경북대 X IT동아] IT동아갤로그로 이동합니다. 02.24 45 0
6662 슬립웨이브 “빛과 소리로 숙면의 페이스메이커 꿈꾼다” [2025 고려대 초창패] IT동아갤로그로 이동합니다. 02.24 68 0
6661 [IT신상공개] 노이즈 캔슬링·음질·통화 품질·디자인 개선, 소니 WF-1000XM6 IT동아갤로그로 이동합니다. 02.24 58 0
6660 모티프 합류로 다시 불붙은 독자 AI 파운데이션 사업··· '4강 구도 짚어보니' IT동아갤로그로 이동합니다. 02.24 49 0
6659 SBA "아웃바운드 프로그램, 중소기업 인도네시아 진출 활성화" IT동아갤로그로 이동합니다. 02.24 51 0
6658 [자동차와 法] 교통사고 관련 오해와 진실 [1] IT동아갤로그로 이동합니다. 02.24 732 2
6657 웨스컴 "AI 기반 멀티 클라우드 전문 기업으로 도약할 것" [과기대 딥테크] IT동아갤로그로 이동합니다. 02.24 268 1
6656 [투자를IT다] 2026년 2월 3주차 IT기업 주요 소식과 시장 전망 IT동아갤로그로 이동합니다. 02.23 60 0
6655 "데이터 넘어 행동으로" 바이탈릭스, AI 멀티 에이전트로 헬스케어 혁신 꿈꾼다 [과기대 딥테크] IT동아갤로그로 이동합니다. 02.23 101 0
6654 [뉴스줌인] 답변만 하는 AI는 옛말… 갤럭시 S26에 스스로 일하는 'AI 에이전트' 추가? [2] IT동아갤로그로 이동합니다. 02.23 1029 6
6653 [월간자동차] 26년 1월, 국산 ‘기아 쏘렌토’·수입 ‘벤츠 E-클래스’ 1위 탈환 IT동아갤로그로 이동합니다. 02.23 55 0
6652 ‘지난해 2700만 악성 앱 차단’…구글이 안드로이드 생태계를 지키는 방법 IT동아갤로그로 이동합니다. 02.23 102 0
6651 [리뷰] “RED향 진하게 담았다” 니콘 시네마 카메라, ZR IT동아갤로그로 이동합니다. 02.23 392 0
6650 [K-스페이스 퀀텀 점프] 4. UAM 상용화의 전제 조건 IT동아갤로그로 이동합니다. 02.23 61 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2