디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

노타·퓨리오사AI, AI 최적화 기술 협력으로 공동 사업화 나선다

IT동아갤로그로 이동합니다. 2026.02.03 13:18:39
조회 60 추천 0 댓글 0
[IT동아 남시현 기자] AI 모델 경량화 및 최적화 기술 기업 노타와 AI 반도체 팹리스 기업 퓨리오사AI가 사업 영역 확대를 목표로 기술협력을 진행한다. 노타의 주력 사업은 인공지능 모델의 크기는 줄이면서 성능은 최대한 유지하는 기술인 ‘모델 양자화’다. 지난 2022년 AI 모델 경량화 플랫폼 ‘넷츠프레소(NetsPresso)’를 출시해 현재는 모델 개발, 모델 최적화, 모델 검증 세 종류의 작업을 지원한다. 퓨리오사AI는 지난 2024년 6월 2세대 신경망 처리장치(NPU) RNGD(레니게이드)를 공식 출시했으며 최근 양산 물량을 전달받고 제품 인도에 들어갔다.


퓨리오사AI의 2세대 NPU



현재 RNGD는 서버 환경에서 대형언어모델을 추론하는데 최적의 효율을 발휘한다. AI 반도체는 데이터를 학습해 모델 자체를 구성하는 ‘학습’ 과정과 만들어진 모델을 구동하는 ‘추론’ 용도로 나뉜다. 엔비디아의 GPU는 학습과 추론 모든 용도로 활용할 수 있지만, 학습용 수요로 인해 추론 용도로는 총소유비용이 높은 편이다. 이에 AI 추론 용도로는 GPU 대신 RNGD를 대신 활용하자는 것이 퓨리오사AI의 제안이다.

이때 구동하는 모델이 용량이나 메모리 자원을 많이 요구하면 그만큼 많은 연산용 카드가 필요하고, 전력 소모도 커진다. AI 모델을 양자화해서 구동하면 메모리 요구량은 크게 절감하고 상대적으로 더 많은 모델을 구동할 수 있다. 예를 들어 메타 Llama 3.1 70B 모델은 약 140GB의 비디오 메모리가 필요한데, 이를 4비트(INT4)로 양자화하면 35~40GB로 메모리 사용량을 줄일 수 있다. 압축 과정에서 품질이 일부 손실되긴 하나 가능한 원본과 비슷하게 정확성을 유지하는 것이 양자화 기술 기업의 능력이다.


노타 넷츠프레소를 활용해 CGG19 및 MobileNetV1을 각각 양자화 한 성능 결과 / 출처=노타



노타의 넷츠프레소는 경우에 따라 모델 크기를 최대 10분의 1까지 압축하고, 경우에 따라 최대 42배까지 추론 속도를 높인다. 19개의 레이어(16개 합성곱+3개 완전연결)로 구성된 CNN 모델 CGG19을 양자화한 결과에서는 기존 5.28FPS로 동작하던 게 압축 후 222.22FPS로 동작했으며, MobileNetV1도 28.08FPS에서 480.77FPS로 17배 빨라졌다. 반면 VGG19 압축 시 정확도는 72.28%에서 1.14%, MobileNetV1은 66.68%에서 66.11%로 0.57%만 성능이 줄었다. 특정 모델을 압축해 더 많은 모델을 지원하고 AI 가속기의 동작 효율을 확대하는 것이 넷츠프레소의 역할이다.

또한 노타는 하드웨어 AI 최적화(Hardware-aware AI optimization) 기술을 통해 최적으로 동작하는 하드웨어를 지원한다. 기존에는 전문 AI 엔지니어가 하드웨어를 맞추는데 수개월이 걸렸는데 넷츠프레소의 자동화 파이프라인을 통한 사전 지원으로 이 과정을 넘어 바로 모델을 구축할 수 있다. 현재 Arm, 퀄컴, 엔비디아, 르네사스 등의 엣지용 제품 위주로 최적화가 되고 있는데 퓨리오사AI의 RNGD도 이 최적화 목록에 이름을 올릴 것으로 보인다.


노타의 시각 인식 AI 설루션 노타 비전 에이전트에도 RNGD를 접목한다 / 출처=노타



한편 노타와 퓨리오사AI는 노타의 시각 인식 AI 설루션 ‘노타 비전 에이전트(NVA)’에 RNGD를 결합한 패키지 설루션을 선보인다. 지난 11월 기술협력 양해각서를 통해 기술 공급의 물꼬를 텄고, 이번 협력으로 공동 비즈니스 모델 구축을 시작하는 것이다. 노타 비전 에이전트는 시각 언어 모델(Vision-Language Model)을 기반으로 촬영 화상에 대한 실시간 모니터링, 맥락 기반의 사건 요약 및 분석 보고서 생성, 자연어 기반의 질의응답 및 영상 검색 등을 지원한다. 여기에 RNGD의 비전 처리 성능을 결합해 일괄 형태의 AI 장치로 제공하겠다는 것이다.

퓨리오사AI 입장에서는 다양한 산업 현장에서 RNGD가 쓰일 수 있음을 증명한다. 최근 보안, 의료, 유통 등은 물론 도시 관제, 스마트 빌딩 등 다양한 분야에서 CCTV와 AI를 결합하고 있다. 노바 비전 에이전트가 다양한 분야에서 활용될수록 RNGD의 비전 처리 성능도 다양하게 지원할 수 있음을 보여주는 셈이다.

채명수 노타 대표는 “이번 계약은 넷츠프레소의 AI 하드웨어 최적화 기술이 모바일, 모빌리티 등 온디바이스 AI 환경을 넘어 고성능 데이터 센터 영역까지 확장되고, 시장 내 상용화 가치를 다시 한번 입증한 결과”라며 “퓨리오사AI와 함께 대한민국의 AI 기술력을 세계 시장에 선보이겠다”라고 밝혔다.

백준호 퓨리오사AI 대표는 “퓨리오사AI의 혁신적인 NPU 기술과 노타의 고도화된 AI 최적화 역량의 결합은 세계 시장에서 한국형 AI의 저력을 증명하는 계기가 될 것”이라며 “노타와의 긴밀한 협업을 통해 실제 산업 현장에서 높은 성능과 효율을 제공하는 설루션을 선보이겠다”는 뜻을 밝혔다.

상업 운전 시작하는 퓨리오사AI, 상반기 이후에는 성과 기대해볼만



지난해 12월 노타와 퓨리오사AI가 양해각서를 체결했고, 이번에 본격적으로 공동사업화에 나선다 / 출처=-노타



퓨리오사AI는 지난해 LG AI 연구원과 함께 8개의 RNGD 카드를 렉 형태로 엮은 NXT-RNGD 서버로 엑사원 모델을 인터넷 연결 없이 구동하는 패키지를 구성하겠다고 밝혔다. 또한 미국계 AI 인프라 기업 바이트브릿지와 함께 아시아 태평양 지역 전반의 디지털 인프라 지원을 위한 협력 구도를 구축했다. 상품화 측면에서는 딥노이드와 의료용 영상 판독·진단 보고용 AI M4CXR 지원 상품화도 진행 중이며, 노타AI의 NVA 지원도 같은 맥락이다.

그리고 지난 1월 28일에는 TSMC에서 생산하고 에이수스에서 조립한 RNGD 카드 4000장을 공식적으로 인도했다고 발표했다. 지난해부터 다각적으로 맺어온 기술협력, 양해각서 등의 AI 반도체 수요에 본격적으로 대응하고, 제품 판매도 시작할 수 있음을 의미한다. 물론 메모리 수급 등의 문제로 최근 AI 반도체 시장 자체의 향방이 불투명한 상황인데, 퓨리오사AI가 순조롭게 나아갈 수 있을지 귀추가 주목된다.

IT동아 남시현 기자 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 이통3사, AI 기본법 시행 맞춰 거버넌스 강화▶ “듣는 음악 넘어 함께 소통하는 음악으로”...버시스가 그리는 AI 뮤직테크의 미래 [경북대 X IT동아]▶ 퓨리오사AI, NPU 'RNGD' 양산 돌입··· '한국 넘어 세계시장 향한다'



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 예능과 잘 맞지 않는 것 같은 스타는? 운영자 26/03/16 - -
6765 빗썸, 특금법 위반 ‘368억 원 과태료·6개월 일부 영업정지’ IT동아갤로그로 이동합니다. 12:37 4 0
6764 [신차공개] 8기통 오픈톱 '페라리 아말피 스파이더'·2027년형 '르노 아르카나' 출시 [1] IT동아갤로그로 이동합니다. 03.16 816 1
6763 [정석희의 기후 에너지 인사이트] 6. 왜곡된 기후 데이터의 함정과 과학적 실체 IT동아갤로그로 이동합니다. 03.16 12 0
6762 [주간투자동향] 나이트라, 2750억 원 규모 투자 유치 外 IT동아갤로그로 이동합니다. 03.16 27 0
6761 이력서 대신 난제 던진 일론 머스크, '파격적이지만 정답이 있는 문제' IT동아갤로그로 이동합니다. 03.13 102 0
6760 그룹아이비 “23년 쌓은 범죄 데이터 무기로 韓 공급망 보안 시장 공략” IT동아갤로그로 이동합니다. 03.13 19 0
6759 울산교육청 “AI는 차단할 기술 아닌 교육의 대상…‘우리 아이(AI)’ 플랫폼 구축 배경” IT동아갤로그로 이동합니다. 03.13 21 0
6758 [IT하는법] 스마트폰 기본 앱, 삭제하거나 숨기는 법 IT동아갤로그로 이동합니다. 03.13 102 0
6757 [황성진의 '고대 사상가, AI를 만나다'] 6/완. 칸트가 AI 시대에 태어났다면 말했을 한 마디 IT동아갤로그로 이동합니다. 03.13 26 0
6756 일상 속 스며든 유선ㆍ무선 네트워크 기술, 어떻게 구현될까? IT동아갤로그로 이동합니다. 03.13 81 0
6755 "위급할수록 빠르게" 119안심콜 서비스, 취약계층 전용 아니었다 IT동아갤로그로 이동합니다. 03.12 30 0
6754 [자동차 디자人] ‘강력한 우아함’으로 ‘지커’ 정체성 구축…슈테판 실라프 디자인 총괄 IT동아갤로그로 이동합니다. 03.12 25 0
6753 레노버 테크데이 26, “기업 AI, 이제는 ‘실험’ 아닌 ‘실행’의 때” IT동아갤로그로 이동합니다. 03.12 26 0
6752 천만 관객 시대, 야구 산업 속 첨단 기술 살펴보니 IT동아갤로그로 이동합니다. 03.12 25 0
6751 2026 BCMC “블록체인은 AI 시대의 신뢰 인프라” IT동아갤로그로 이동합니다. 03.12 112 0
6750 상승기류 타는 AI PC, 2026년 'NPU 기반 온디바이스 AI' 활용도 높아진다 IT동아갤로그로 이동합니다. 03.12 68 0
6749 [주간보안동향] 이란 전쟁이 야기한 사이버 위협, 기업 대응 방안은 外 IT동아갤로그로 이동합니다. 03.12 27 0
6748 “벤처ㆍ혁신기업에 투자” 기업성장펀드(BDC)는 다른 펀드와 무엇이 다를까? IT동아갤로그로 이동합니다. 03.12 34 0
6747 [주간스타트업동향] 반프, 실리콘랩스와 지능형 타이어 모니터링 솔루션 발표 外 IT동아갤로그로 이동합니다. 03.11 95 0
6746 '모바일 확대 개편' 우리동네 기후환경정보, 기존 날씨 앱과 무엇이 다를까 IT동아갤로그로 이동합니다. 03.11 30 0
6745 디지털자산 거래소, 법인 고객 서비스 강화 ‘법인 시장 참여 대비’ IT동아갤로그로 이동합니다. 03.11 498 0
6744 SBA, 12개 대기업과 혁신 스타트업 발굴…‘2026 서울 오픈이노베이션 파트너스 데이’ 개최 IT동아갤로그로 이동합니다. 03.11 33 0
6743 [현장] 에이수스 “2026 젠북 시리즈, 촉감부터 A/S까지 차별화” IT동아갤로그로 이동합니다. 03.10 30 0
6742 지노 발리스트레리 HP UAV 총괄 "한국 드론 시장, 신속·신뢰·혁신성 돋보여" IT동아갤로그로 이동합니다. 03.10 33 0
6741 “지역에 머무는 여행, 어떻게 만들까”…에어비앤비가 제주서 내놓은 청사진 IT동아갤로그로 이동합니다. 03.10 30 0
6740 [위클리AI] 오픈AI, GPT-5.4 출시 '워크플로우 특화 모델' 외 IT동아갤로그로 이동합니다. 03.10 339 0
6739 [K-스페이스 퀀텀 점프] 5/완. 항공안전을 위한 기업문화가 만들어지는 법 IT동아갤로그로 이동합니다. 03.10 29 0
6738 '세대교체·신규 라인업 등장'··· 팀 쿡 시대 저물고 새로운 애플이 온다 IT동아갤로그로 이동합니다. 03.10 68 0
6737 [스타트업 브랜딩 가이드] 로고 제작은 디자인이 아니라 신뢰 설계다 IT동아갤로그로 이동합니다. 03.10 68 0
6736 SBA "2025 서울콘 1757억 경제효과, K 컬처 비즈니스 플랫폼으로" IT동아갤로그로 이동합니다. 03.10 33 0
6735 [IT신상공개] 누음 줄인 오픈형 이어폰 JBL 센스 프로·사운드기어 클립스 IT동아갤로그로 이동합니다. 03.10 93 0
6734 [자동차와 法] 교통안전 및 과실비율 산정에 AI 활용하는 주요국 사례 IT동아갤로그로 이동합니다. 03.10 344 1
6733 프로덕트테크 “플라스틱 폭탄 된 부직포 필터…친환경 금속 필터로 순환 경제 실현” IT동아갤로그로 이동합니다. 03.10 37 0
6732 [투자를IT다] 2026년 3월 1주차 IT기업 주요 소식과 시장 전망 IT동아갤로그로 이동합니다. 03.09 44 0
6731 갤 S26 나왔는데…'콘서트 필수폰'은 아직도 S23 울트라? IT동아갤로그로 이동합니다. 03.09 100 0
6730 10년 전 알파고와 겨뤘던 이세돌, 인공지능과 손잡은 이유 IT동아갤로그로 이동합니다. 03.09 97 0
6729 웬디미디어, 국내 최초 멀티 에이전트 AI 라이브 방송으로 갤럭시26 사전판매 73억 기록 IT동아갤로그로 이동합니다. 03.09 98 0
6728 에어비앤비 “올해 목표는 지역 여행 활성화”…제주서 꺼낸 해법은 ‘공간·콘텐츠·사람’ IT동아갤로그로 이동합니다. 03.09 32 0
6727 에이블캠퍼스 최혜린 총괄 "AI 도입, 개발 엔지니어의 고차원 교육이 내재화에 큰 역할" IT동아갤로그로 이동합니다. 03.09 39 0
6726 [주간투자동향] 사운드리퍼블리카, 시리즈A 브릿지 후속 투자 유치 外 IT동아갤로그로 이동합니다. 03.09 58 0
6725 디지털 전략에 진심인 IBK 기업은행, '두레이(Dooray!)'로 협업문화 가속 IT동아갤로그로 이동합니다. 03.09 42 0
6724 기술은 현실을 반영해야 한다: 다양한 경험이 만드는 기술 혁신 [세계 여성의 날] [5] IT동아갤로그로 이동합니다. 03.08 478 0
6723 [리뷰] 4K 240Hz에 QD-OLED? 타협 없는 게이밍 모니터, ‘레노버 리전 프로 32UD-10’ IT동아갤로그로 이동합니다. 03.06 91 0
6722 [AI 써봄] “누구라도 몇 초 만에 아티스트가 된다” 구글 나노 바나나 2 IT동아갤로그로 이동합니다. 03.06 46 0
6721 "자동차, 이제 홈쇼핑으로 사세요", 권용국 차봇모빌리티 부문장 IT동아갤로그로 이동합니다. 03.06 53 0
6720 [스타트업-ing] "스마트폰 하나로 전문 코칭까지" 키넥스, 스포츠 훈련 더 가깝게 돕는다 IT동아갤로그로 이동합니다. 03.06 44 0
6719 "무료로 3분 만에 분석" 반려식물 추천 서비스, 직접 써보니 IT동아갤로그로 이동합니다. 03.06 45 0
6718 AI의 무기화 시작한 美 정부, 'LLM'은 어떻게 알고리즘 전쟁의 종심이 됐나 [11] IT동아갤로그로 이동합니다. 03.06 1242 3
6717 넥스트챌린지, "2026 구글플레이 협업 '창구 프로그램' 참여 기업을 찾습니다" IT동아갤로그로 이동합니다. 03.06 41 0
6716 [리뷰] 실용성 더한 오픈형 이어폰, 소니 링크버즈 클립 IT동아갤로그로 이동합니다. 03.06 341 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2