앤트로픽(Anthropic)이 사이버 보안 역사상 뛰어난 수준의 성능을 가진 AI 모델을 공개했다. 클로드 미토스 프리뷰(Claude Mythos Preview)라는 이름의 이 모델은 주요 운영체제와 웹 브라우저에서 수천 개의 심각한 보안 취약점을 찾아냈다. 그중 일부는 27년간 인간 전문가와 수백만 번의 자동화 테스트를 통과하며 숨어 있었다. 앤트로픽은 이 위험한 능력을 방어 목적으로만 사용하기 위해 아마존(Amazon), 애플(Apple), 구글(Google), 마이크로소프트(Microsoft), 시스코(Cisco), 엔비디아(NVIDIA) 등 12개 주요 기업과 프로젝트 글래스윙(Project Glasswing)을 출범했다. 공격자보다 먼저 결함을 찾아 막지 않으면, 전 세계 경제, 공공안전, 국가안보에 심각한 파급효과가 우려된다는 판단에서다.
DARPA 사이버 그랜드 챌린지 10년 뒤, AI가 이제 인간을 앞섰다
미국 방위고등연구계획국(DARPA)이 2014년 처음 사이버 그랜드 챌린지(Cyber Grand Challenge)를 열었을 때, AI가 소프트웨어 취약점을 자율적으로 찾고 공격하는 일은 먼 미래의 이야기였다. 10년이 지난 지금, 클로드 미토스 프리뷰는 대부분의 인간 전문가를 능가하고, 최고 수준 전문가와도 경쟁 가능한 성능을 보인다. 앤트로픽이 공개한 사례를 보면 이 모델이 얼마나 정교한지 알 수 있다. 세계에서 가장 보안이 철저하다고 알려진 오픈BSD(OpenBSD) 운영체제에서 27년 동안 발견되지 않았던 원격 접속 취약점을 찾아냈고, 전 세계 서버 대부분을 구동하는 리눅스 커널(Linux Kernel)에서 여러 취약점을 연결해 일반 사용자 권한을 관리자 권한으로 상승시키는 공격 경로를 스스로 개발했다. 동영상 인코딩과 디코딩에 사용되는 FFmpeg 라이브러리에서는 자동화 테스트 도구가 500만 번 지나쳤던 코드 한 줄에서 16년 묵은 결함을 찾아냈다.
이 모든 작업은 인간의 개입 없이 모델이 자율적으로 수행했다. 평가 벤치마크인 사이버짐(CyberGym) 취약점 재현 평가에서 미토스 프리뷰는 83.1%의 취약점 재현율을 기록했다. 앤트로픽의 이전 최고 모델인 클로드 오퍼스 4.6(Claude Opus 4.6)이 66.6%에 그친 것과 비교하면 16.5%포인트 높다. 이 격차는 단순히 숫자 차이가 아니다. 미토스 프리뷰는 코드 추론(Reasoning) 능력이 근본적으로 달라졌다. 소프트웨어 엔지니어링 벤치마크 SWE-bench 검증 버전(SWE-bench Verified)에서 93.9%를 기록하며 오퍼스 4.6(80.8%)를 13.1%포인트 앞섰고, 터미널 벤치 2.0(Terminal-Bench 2.0)에서도 82.0%로 오퍼스 4.6(65.4%)를 16.6%포인트 초과했다. 이 수준의 코드 이해력과 추론 능력이 결합되자, AI는 인간이 수십 년간 놓쳤던 보안 허점을 몇 시간 만에 찾아낼 수 있게 됐다.
앤트로픽_사이버보안 취약점 재현 성능 비교_CyberGym 벤치마크 결과
앤트로픽_사이버보안 취약점 재현 성능 비교_CyberGym 벤치마크 결과
연간 500조 원 규모 사이버 범죄, AI 공격자가 장악하기 전에 방어선을 쳐야 한다
전 세계 사이버 범죄로 인한 연간 피해액은 약 5000억 달러, 한화로 약 650조 원 수준에 달한다. 중국, 이란, 북한, 러시아 같은 국가 지원 공격 행위자들은 에너지 인프라, 금융 시스템, 의료 네트워크, 군사 시스템을 지속적으로 공격해왔다. 지금까지는 소프트웨어 취약점을 찾고 공격 코드를 개발하는 일이 극소수 숙련된 보안 전문가의 영역이었기 때문에 공격 빈도와 규모에 일정한 한계가 있었다. 하지만 미토스 프리뷰 수준의 AI 모델이 확산되면 이 균형은 완전히 무너진다. 공격에 필요한 비용, 시간, 전문성이 급격히 낮아지면서 사이버 공격은 더 빈번하고 정교해질 수밖에 없다. 병원 하나를 마비시키거나 학교 시스템을 해킹하는 소규모 공격도 민감한 데이터 유출과 경제적 손실을 일으키며, 심각한 경우 인명 피해로 이어질 수 있다.
앤트로픽은 이 위기를 방어 기회로 전환하기 위해 프로젝트 글래스윙을 시작했다. 아마존 웹 서비스(AWS), 애플, 구글, 마이크로소프트, 시스코, 크라우드스트라이크(CrowdStrike), 엔비디아, 팔로알토 네트웍스(Palo Alto Networks), JP모건체이스(JPMorganChase), 리눅스 재단(Linux Foundation) 등 12개 출범 파트너와 40개 이상의 추가 조직이 미토스 프리뷰를 사용해 자사 및 오픈소스 시스템을 점검·보호하게 된다. 앤트로픽은 이 작업에 최대 1억 달러(약 1300억 원) 상당의 모델 사용 크레딧을 제공하고, 오픈소스 보안 생태계에는 총 400만 달러를 기부했다. 이 중 리눅스 재단을 통해 알파-오메가(Alpha-Omega)와 오픈SSF(OpenSSF)에 250만 달러, 아파치 소프트웨어 재단(Apache Software Foundation)에 150만 달러를 지원해 오픈소스 유지관리자들이 AI 시대 보안 환경 변화에 대응할 수 있도록 했다.
방어자가 이기려면 공격자보다 빨라야 한다, 시간이 없다
크라우드스트라이크의 최고기술책임자(CTO) 엘리아 자이체프(Elia Zaitsev)는 "취약점이 발견되고 공격자가 이를 악용하기까지 걸리는 시간은 과거 몇 달에서 이제 몇 분으로 줄었다"며 "AI 때문에 속도를 늦출 이유가 아니라, 함께 더 빨리 움직여야 할 이유"라고 말했다. 시스코의 최고보안신뢰책임자(Chief Security & Trust Officer) 앤서니 그리에코(Anthony Grieco)는 "AI 능력이 임계점을 넘어서면서 핵심 인프라 보호에 필요한 긴박함이 근본적으로 바뀌었다"며 "과거 방식으로는 더 이상 충분하지 않다"고 강조했다. 마이크로소프트는 자사의 오픈소스 보안 벤치마크 CTI-REALM에서 미토스 프리뷰를 테스트한 결과 이전 모델 대비 상당한 성능 향상을 확인했다고 밝혔다.
AWS는 하루 400조 건 이상의 네트워크 플로우를 분석해 위협을 탐지하는데, 미토스 프리뷰를 내부 보안 운영에 적용해 핵심 코드베이스를 강화하고 있다. 팔로알토 네트웍스는 "이전 세대 모델이 놓쳤던 복잡한 취약점을 미토스 프리뷰가 찾아냈다"며 "공격자가 이 모델에 접근하기 전에 오픈소스 소유자와 방어자 모두가 먼저 사용해야 한다"고 말했다. 리눅스 재단 CEO 짐 젬린(Jim Zemlin)은 "과거 보안 전문성은 대규모 보안팀을 갖춘 조직만 누릴 수 있는 사치였다"며 "오픈소스 유지관리자에게 AI 기반 보안 도구를 제공하면 비싼 보안팀을 고용할 수 없는 이들도 신뢰할 수 있는 보안 파트너를 얻게 된다"고 평가했다.
미토스 프리뷰는 일반 공개되지 않는다, 안전장치가 먼저다
앤트로픽은 클로드 미토스 프리뷰를 일반에 공개하지 않을 계획이다. 이 모델의 사이버 공격 능력이 악의적으로 사용될 경우 피해가 너무 크기 때문이다. 대신 앞으로 출시될 차기 클로드 오퍼스 계열 모델에 위험한 출력을 탐지하고 차단하는 새로운 안전장치를 먼저 적용해 개선하고, 이후 미토스급 모델을 안전하게 배포할 방법을 마련할 예정이다. 연구 프리뷰 이후에는 참여 조직들이 클로드 API, 아마존 베드락(Amazon Bedrock), 구글 클라우드 버텍스 AI(Google Cloud Vertex AI), 마이크로소프트 파운드리(Microsoft Foundry)를 통해 입력 100만 토큰당 25달러, 출력 100만 토큰당 125달러에 사용할 수 있다.
앤트로픽은 90일 이내에 학습한 내용과 수정된 취약점, 공개 가능한 개선 사항을 공식 보고할 예정이며, 주요 보안 조직과 협력해 AI 시대 보안 관행이 어떻게 진화해야 하는지에 대한 실용적 권고안을 발표할 계획이다. 여기에는 취약점 공개 절차, 소프트웨어 업데이트 프로세스, 오픈소스 및 공급망 보안, 소프트웨어 개발 생명주기 및 보안 설계 원칙, 규제 산업 표준, 자동화된 분류 및 패치 작업 등이 포함된다. 앤트로픽은 또한 미국 정부 관계자들과 미토스 프리뷰의 공격 및 방어 능력에 대해 지속적으로 논의하고 있으며, 미국과 동맹국들이 AI 기술에서 결정적 우위를 유지해야 한다고 주장하며, 관련 위험 평가와 완화를 위해 정부와 협력할 준비가 돼 있다고 밝혔다.
앤트로픽은 중장기적으로 민간과 공공 부문 조직을 모두 포함하는 독립적인 제3자 기구가 이런 대규모 사이버 보안 프로젝트를 지속적으로 운영하는 것이 이상적이라고 보고 있다. 프로젝트 글래스윙은 시작점일 뿐이다. AI 능력은 앞으로 몇 달 내에 또다시 크게 발전할 가능성이 높다. 방어자가 앞서 나가려면 지금 당장 움직여야 한다. 공격자가 같은 도구를 손에 넣기 전에.
FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q. 클로드 미토스 프리뷰는 어떻게 27년 묵은 보안 결함을 찾아낸 건가요?
미토스 프리뷰는 코드를 읽고 추론하는 능력이 이전 모델보다 훨씬 뛰어나며, 소프트웨어의 취약점을 자율적으로 탐지하고 공격 경로를 개발할 수 있습니다. 오픈BSD에서 27년 묵은 취약점을 찾아냈는데, 이는 공격자가 원격으로 시스템을 크래시시킬 수 있는 문제였습니다. 인간 전문가와 자동화 테스트 도구가 수십 년간 놓친 결함이었지만, 미토스 프리뷰는 코드의 미묘한 논리적 오류를 스스로 찾아냈습니다.
Q. 프로젝트 글래스윙은 구체적으로 무엇을 하는 프로젝트인가요?
프로젝트 글래스윙은 앤트로픽과 12개 주요 기술 기업이 함께 클로드 미토스 프리뷰를 사용해 전 세계 핵심 소프트웨어의 보안 취약점을 선제적으로 찾아 수정하는 방어 중심 사이버 보안 이니셔티브입니다. 앤트로픽은 최대 1억 달러 상당의 모델 사용 크레딧과 400만 달러의 직접 기부를 통해 오픈소스 보안 조직을 지원합니다.
Q. 미토스 프리뷰는 일반 사용자도 사용할 수 있나요?
아니요. 앤트로픽은 미토스 프리뷰의 강력한 사이버 공격 능력이 악용될 위험 때문에 일반 공개 계획이 없습니다. 대신 프로젝트 글래스윙 파트너와 승인된 조직에만 제한적으로 제공하며, 향후 안전장치를 개발한 뒤 미토스급 모델을 안전하게 배포할 방법을 마련할 예정입니다.
댓글 영역