라그랑주는 2025년 4분기에 자사의 zkML 시스템 DeepProve의 핵심 아키텍처를 대폭 확장하며 의미 있는 기술적 진전을 이뤘다.
단일 노드 기반 구조에서 벗어나 GPU 기반의 분산 증명 파이프라인으로 진화한 이번 업그레이드는, 실전 추론 수준의 작업 부하를 견딜 수 있는 범용성과 성능 확보에 중점을 두고 진행됐다.
암호학적 실행 구조와 텐서 연산 방식, 메모리 흐름, 병목 구간 성능 최적화까지 전방위적 개선이 이루어졌고, 그 결과 DeepProve는 생산 환경에서 안정적으로 동작 가능한 zkML 시스템으로 나아가고 있다.
특히 증명 로직은 선형적 순차 실행 방식에서 벗어나 명시적 실행 그래프 기반으로 재설계되었다.
계산 및 증명 의무를 각 노드로 분할하고 이를 독립적인 파티션으로 나눈 뒤, 각 파티션을 네트워크 주소처럼 기능하는 고유한 '컬러'로 구분하여 분산 서버에 병렬 할당하는 구조가 도입되었다.
이를 통해 DeepProve는 순차형 증명 흐름이 아닌 병렬형 증명 시스템으로 전환되었으며, 현재는 이 분산 실행 구조 내에 전체 암호학 증명 로직을 통합하는 작업이 완료 단계에 있다.
선형 연산 구조 역시 전면적으로 정비되어,기존의 dense layer나 QKV projection 등 개별적으로 구현되던 연산 계층은 모두 einsum 기반 선언형 연산 방식으로 통합되었다.
다양한 텐서 순위 조합을 지원하도록 증명 로직이 일반화되면서, 코드베이스는 간결해졌고 구조적 일관성과 향후 모델 적용 유연성은 더욱 커졌다.
zkML에서 가장 계산량이 큰 영역 중 하나인 비선형 계층에서는, 그동안 softmax, ReLU, GELU 등 각 연산에 대해 별도 구현과 별도 requantization 단계가 필요했다.
이번 분기에는 이를 통합한 범용 Lookup 계층이 도입되어, 함수 종류만 바꾸면 동일한 구조로 재활용 가능한 비선형 처리 방식이 구현되었다.
requantization도 Lookup 계층 내부에서 처리되도록 하여 연산 흐름은 더욱 단순해졌고, 전체 성능도 향상되었다.
모델 정밀도 평가도 병행되어, DeepProve가 지원하는 대표적 모델인 GPT-2는 PyTorch FP32 기준 대비 perplexity 증가가 1% 미만에 불과했고, Gemma-3 모델은 약 4% 수준의 오차 범위에 머물렀다.
이는 성능 최적화를 거치면서도 DeepProve의 증명 파이프라인이 수치적 정확도를 충분히 유지하고 있음을 보여준다.
시퀀스 기반 모델의 추론 효율을 높이기 위해, 위치 기반 캐시와 텐서 연결 캐시를 도입한 것도 주목할 만하다.
시퀀스 위치를 추적하는 캐시와 QKV 투영으로 생성된 K/V 행렬을 누적하는 구조를 분리 도입함으로써, 긴 시퀀스 또는 반복 추론에서의 효율과 증명 재사용성이 크게 향상되었다.
한편 텐서의 저장, 전송, 연산 과정을 통합하는 메모리 흐름 구조도 새롭게 도입됐다.
디스크, RAM, GPU VRAM 등 이질적인 환경 간 텐서 전환이 매끄럽게 이루어지도록 구조를 정비하였고, 이는 향후 비동기 증명, GPU 기반 실행, 분산 증명 등의 고도화에 필요한 기반 기술로 작동할 것으로 보인다.
모든 모델 계층이 GPU 기반 실행을 지원하게 된 점도 주목할 변화다.
단순히 지연 시간을 줄이는 데서 그치지 않고, ‘낙관적 증명(Optimistic Proving)’이라는 새로운 운영 모드를 가능하게 했다.
이 방식은 사용자가 추론 결과를 즉시 받아볼 수 있도록 한 뒤, 증명은 별도로 생성되어 사후 제공된다. 실시간성이 중요한 상황에서 암호학적 무결성을 유지할 수 있는 구조다.
최종적으로 DeepProve는 초당 약 1.5건의 증명을 안정적으로 생성할 수 있는 성능을 입증했다.
이는 zkML이 더 이상 오프라인 처리에 한정되지 않고, 실시간 추론 흐름에 동기화된 형태로 작동할 수 있음을 보여주는 전환점이다.
또한 이 처리량은 향후 더 넓은 병렬화, 하드웨어 가속, 분산 시스템 확장을 위한 기준선이 될 것으로 보인다.
2025년 4분기 기술 업데이트는 DeepProve가 실험적 프로토타입 단계에서 벗어나, 고성능 추론 환경에서도 실제 운용이 가능한 zkML 시스템으로 한 걸음 더 나아갔음을 보여주는 이정표라 할 수 있다.
분산 처리, 메모리 흐름 통합, 증명 병렬화, GPU 최적화 등 핵심적인 개선 요소들이 유기적으로 맞물리며, 라그랑주는 생산 환경에 투입 가능한 zk 기반 AI 검증 시스템을 현실화하는 데 성큼 다가서고 있다.
한편, 라그랑주 한국 커뮤니티는 오는 1월 23일 오후 9시, 텔레그램 공식 채널을 통해 퀴즈 이벤트를 진행할 예정이다.
이번 이벤트에서는 배달의민족 5만 원 상품권(1명), 1만 원권(10명), 스타벅스 아메리카노 쿠폰(50명)이 경품으로 제공되며, zkML에 관심 있는 유저라면 누구나 참여할 수 있다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.