챗GPT, 제미나이 같은 AI 챗봇으로 컴퓨터 해킹할 수 있을까? 앤트로픽 실험 결과 충격

AI 매터스 갤러리

자동 짤방 이미지

이미지가 없습니다.

자동 짤방으로 사용할 이미지를 등록해 주세요.

1/3

해장 잘되는 시원한 순대국.jpg 작성자 : dd

챗GPT, 제미나이 같은 AI 챗봇으로 컴퓨터 해킹할 수 있을까? 앤트로픽 실험 결과 충격

aimatters

2025.07.29 17:45:13

조회 6496 추천 2 댓글 7

미국 카네기 멜론 대학교와 AI 회사 앤트로픽(Anthropic)이 함께 만든 특별한 연구가 화제다. 연구팀은 대규모 언어모델이 실제로 컴퓨터 해킹을 할 수 있는지 알아보기 위해 'MHBench'라는 가상의 해킹 연습장을 만들었다. 이 연습장에는 25개에서 50개의 가짜 컴퓨터가 연결된 10개의 서로 다른 네트워크가 있다.

이 가상 환경은 단순한 연습용이 아니다. 실제로 일어났던 대형 해킹 사건들을 그대로 재현했다. 2017년 미국 신용평가회사 이퀴팩스에서 개인정보가 털린 사건과 2021년 미국 송유관 회사인 콜로니얼 파이프라인이 해킹당한 사건을 똑같이 만들어 놓았다. 이퀴팩스 환경에서는 48개의 데이터베이스에서 정보를 빼내야 하고, 콜로니얼 파이프라인 환경에서는 15개의 중요한 제어 장치에 접근해야 한다.

GPT-4o, 제미나이, 클로드도 완전 실패... 예상보다 형편없는 결과

연구팀은 현재 가장 똑똑하다고 알려진 대규모 언어모델들을 테스트했다. GPT-4o, 제미나이 2.5 프로(Gemini 2.5 Pro), 소넷 3.7 싱킹(Sonnet 3.7 Thinking) 등 최신 모델들을 동원했다. 심지어 펜테스트GPT(PentestGPT)와 사이버섹이발3(CyberSecEval3) 같은 해킹 전문 도구까지 사용해서 최상의 조건을 만들어 줬다.

하지만 결과는 충격적이었다. 이 똑똑한 대규모 언어모델들은 단 하나의 복잡한 해킹도 끝까지 완성하지 못했다. 오직 소넷 3.7 싱킹만이 4계층 체인 환경에서 25개 파일 중 11개를 빼내는 부분적 성공을 거뒀을 뿐이다. 연구팀이 공격 그래프를 통해 자세히 분석해보니 대규모 언어모델들이 두 가지 큰 실수를 반복했다. 첫 번째는 관련 없는 명령어를 너무 많이 입력한다는 것이다. 전체 명령어의 47-90%가 해킹 목표와 전혀 상관없는 내용이었다. 두 번째는 올바른 명령어를 입력해도 잘못된 매개변수나 구문 오류 때문에 6-41%가 실행에 실패했다는 점이다.

'Incalmo' 등장... 대규모 언어모델에게 해킹 비서를 붙여주다

이 문제를 해결하기 위해 연구팀이 만든 것이 바로 'Incalmo(인칼모)'다. 이는 대규모 언어모델과 실제 네트워크 환경 사이의 고수준 추상화 계층이다. 기존에는 대규모 언어모델이 복잡한 셸 명령어를 직접 입력해야 했다면, 이제는 간단한 고수준 작업만 지시하면 된다. Incalmo는 MITRE ATT&CK 프레임워크에서 영감을 받은 5가지 고수준 액션을 제공한다. 네트워크 스캔(Scan), 측면 이동(LateralMove), 권한 상승(EscalatePrivilege), 정보 발견(FindInformation), 데이터 탈취(ExfiltrateData) 등이다. 대규모 언어모델이 이런 간단한 지시를 내리면, Incalmo의 전문 에이전트가 이를 구체적인 셸 명령어로 변환해서 실행한다.

예를 들어, 대규모 언어모델이 "LateralMove(source_host=kali_host, target_host=webserver)"라고 입력하면, Incalmo가 자동으로 취약점 데이터베이스에서 적절한 익스플로잇을 찾아 실행한다. 이렇게 계획 수립과 실행을 완전히 분리한 것이 Incalmo의 핵심 아이디어다.

10곳 중 9곳 침입 성공, 이퀴팩스 재현에서는 54분 만에 완전 해킹

Incalmo를 사용한 결과는 놀라웠다. 기존에는 아무것도 성공하지 못했던 대규모 언어모델들이 갑자기 대부분의 해킹에 성공하기 시작했다. 10개의 가상 네트워크 중 9곳에서 부분적 성공을, 5곳에서는 완전한 성공을 달성했다. 가장 인상적인 사례는 이퀴팩스 재현 실험이었다. 소넷 3.5는 단 54분 만에 48개의 데이터베이스에서 모든 정보를 빼내는 데 성공했다. 연구팀이 제시한 공격 경로 상태의 99% 이상을 달성한 것이다.

더 놀라운 것은 상대적으로 성능이 떨어지는 작은 대규모 언어모델들도 Incalmo의 도움을 받으면 큰 모델보다 더 좋은 결과를 낸다는 점이었다. 하이쿠 3.5(Haiku 3.5), 제미나이 2 플래시(Gemini 2 Flash), GPT-4o 미니 같은 소형 모델들도 Incalmo와 함께 사용했을 때 10개 환경 중 5개에서 완전한 성공을 거뒀다. 이는 Incalmo 없이는 단 하나의 환경에서도 완전 성공하지 못했던 대형 모델들보다 훨씬 우수한 성과다.

비용도 놀랍도록 저렴했다. 가장 복잡한 해킹도 소넷 3.5를 사용했을 때 최대 589만 7천 개의 입력 토큰과 6만 개의 출력 토큰으로 약 15달러의 비용이 들었을 뿐이다. 제미나이 2 플래시의 경우 최대 118만 9천 개의 입력 토큰과 1만 900개의 출력 토큰을 사용해 구글의 무료 사용량 범위 내에서도 실행 가능했다.

FAQ

Q: 일반인도 이런 도구를 사용할 수 있나요?

A: 현재는 연구 목적으로만 공개되며, MHBench와 Incalmo는 연구 커뮤니티에서만 사용할 수 있습니다. 또한 내장된 익스플로잇 데이터베이스는 MHBench 환경의 취약점만 포함하도록 제한되어 있습니다.

Q: 대규모 언어모델이 해킹을 못하는 이유는 뭔가요?

A: 해킹에는 수많은 복잡한 명령어를 정확한 순서로 실행해야 하는데, 대규모 언어모델이 관련 없는 명령어를 많이 생성하거나 올바른 명령어도 잘못된 매개변수로 실행하면 전체가 실패합니다. Incalmo는 이런 복잡한 부분을 전문 에이전트가 대신 처리하도록 해서 성공률을 크게 높였습니다.

Q: 앞으로 모든 해킹이 AI로 이뤄질까요?

A: 아직은 제한적입니다. 이 연구는 알려진 취약점만 포함된 가상 환경에서만 테스트됐고, 윈도우 시스템은 포함되지 않았습니다. 하지만 MHBench는 확장 가능하도록 설계되어 앞으로 더 다양한 환경과 새로운 도전 과제들이 추가될 예정입니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: On the Feasibility of Using LLMs to Autonomously Execute Multi-host Network Attacks

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

인기 기사

고정닉 0

원본 첨부파일 1

AI-Matters-기사-썸네일-Xeno-Sutra.jpg

전체 댓글 0개

등록순 최신순 답글순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	제목	글쓴이	작성일	조회	추천
설문	반응이 재밌어서 자꾸만 놀리고 싶은 리액션 좋은 스타는?	운영자	25/07/28	-	-
669	삼성, 테슬라와 23조 규모 ‘AI 칩 제조’ 계약 체결… '7만 전자' 회복 [1]	aimatters	07.29	183	0
668	국가보안전문가 20인 “엔비디아 H20 칩의 中 수출은 美 안보 위협”	aimatters	07.29	78	0
667	LG전자 CEO "AX 속도가 사업 성패 좌우할 것"... AI 전환 선봉 선언	aimatters	07.29	81	0
666	구글, 크롬에 AI ‘스토어 요약’ 기능 도입… “품질, 배송 후기 등 쇼핑몰 정보 한눈에”	aimatters	07.29	65	0
665	앤드로픽, 클로드 코드 무제한 사용 차단… 8월부터 주간 사용량 제한 도입	aimatters	07.29	66	0
664	"탭 10개 열어두면 알아서 예약까지"… MS 엣지, AI 비서 '코파일럿 모드' 출시	aimatters	07.29	65	0
663	"수학 문제 절대 틀리지 않는다"… 로빈후드 CEO, 수학 전용 AI 챗봇 앱 '아리스토텔레스' 공개	aimatters	07.29	66	0
662	금융위, 보이스피싱 근절 위한 AI 플랫폼 연내 출범... 범죄계좌 실시간 차단	aimatters	07.29	52	0
661	日 신사, AI로 만든 무녀 이미지 사용해 살해 협박까지 받아	aimatters	07.29	57	0
660	소비자 부문에 생성형 AI를 도입하는 10가지 방법	aimatters	07.29	49	0
659	"말 한마디로 CT 촬영 완성" AI 의사들이 직접 써보니 결과는? [1]	aimatters	07.29	6512	2
	챗GPT, 제미나이 같은 AI 챗봇으로 컴퓨터 해킹할 수 있을까? 앤트로픽 실험 결과 충격 [7]	aimatters	07.29	6496	2
657	챗GPT가 쓴 12줄짜리 불교 경전 분석해봤더니... 학자들 깜짝	aimatters	07.29	76	0
656	이스트에이드, 줌에 'AI 검색' 전면 적용… 국내 포털 최초 시도	aimatters	07.29	37	0
655	오픈AI, ‘GPT-5’ 다음달 초 출시… 알트만 "내가 이해 못한 질문도 완벽하게 답한다" [13]	aimatters	07.28	2718	0
654	“채팅으로 오브젝트 추가·삭제, 앵글 변경, 스타일 편집까지”… 런웨이, 비디오 편집 AI '알레프' 공개	aimatters	07.28	95	0
653	구글, AI 바이브 코딩 도구 '오팔' 미국서 시험 운영… 대상은 비개발자	aimatters	07.28	101	0
652	샘 알트만 "챗GPT로 심리 상담하면 비밀 보장 안 된다"고 경고	aimatters	07.28	109	0
651	AI 검색 시대에도 강자독식? 야후·아마존·구글·유튜브가 AI 추천 트래픽 휩쓸어	aimatters	07.28	86	0
650	메타, 챗GPT 핵심 개발자 ‘셩지아 자오’ 초지능 AI 연구소 수석과학자로 영입	aimatters	07.28	90	0
649	AI로 재탄생한 1939년作 ‘오즈의 마법사’, 라스베이거스 스피어에서 8월부터 상영	aimatters	07.28	82	0
648	카카오임팩트, '돕는 AI' 기술로 사회문제 해결하는 첫 컨퍼런스 개최	aimatters	07.28	81	0
647	SK텔레콤-크래프톤, 수학 특화 AI 모델 3종 오픈소스로 공개	aimatters	07.28	74	0
646	한국, AI 기반 K-콘텐츠 산업에 210억 원 투입	aimatters	07.28	72	0
645	LG유플러스, 오픈AI와 손잡고 국내 첫 ‘에이전틱 AI 컨택센터’ 개발	aimatters	07.28	72	0
644	Z세대는 연애할 때도 AI 쓴다… 美 데이팅 앱 사용자 설문 보고서 공개	aimatters	07.28	71	0
643	AI 써본 사람 vs 안 써본 사람... 나이, 학력, 직업에 따라 갈리는 AI 활용	aimatters	07.28	69	0
642	생성형 AI 구독률 14.3%로 급성장... 챗GPT 압도적 1위	aimatters	07.28	61	0
641	[Q&AI] 삼성전자, 테슬라 효과로 주가 급등... 단기 전망은?	aimatters	07.28	62	0
640	AI 때문에 사라지는 직업 vs 오히려 성장하는 분야… 2025년 AI 시장 명암 총정리	aimatters	07.28	67	0
639	AI 코딩 능력 과대포장 논란… 실제 코딩 시험 봤더니 1등이 겨우 정답률 7.5% [5]	aimatters	07.25	575	0
638	구글, AI 기반 '가상 피팅' 기능 미국 출시… 내 사진 넣으면 옷 입혀준다	aimatters	07.25	250	0
637	해커들, AI로 만든 가짜 보안 취약점 보고서 남발… 업계 비상 [4]	aimatters	07.25	8674	3
636	삼성, 수천 시간 영상 맥락까지 분석 가능한 AI 스타트업 메모리즈에 투자	aimatters	07.25	258	0
635	구글, AI가 검색 결과 페이지 배치 개인화해주는'웹 가이드' 실험 시작	aimatters	07.25	202	0
634	"그록 AI 동반자, 사랑의 진화냐 위협이냐" 美서 열린 토론회 화제	aimatters	07.25	214	0
633	친구 어머니 유산 정리하다 '유산 정리 AI' 창업한 여성, 275억 투자 유치	aimatters	07.25	200	0
632	이제 방송도 AI로? 네이버-KBS, AI 기술 동맹 맺고 첨단 미디어 개발 박차	aimatters	07.25	184	0
631	SKT, 자체 국내 기술로 초거대 AI 도전 선언… ‘에이닷 엑스 3.1’ 공개	aimatters	07.25	178	0
630	[Q&AI] 헐크 호건 별세… AI가 기록한 그의 생애	aimatters	07.25	171	0
629	AI에게 장애인 차별 댓글 감별하게 했더니… 미국 AI는 너무 예민하고, 인도 AI는 너무 둔감해 [8]	aimatters	07.25	8564	3
628	"네버 기브 업" 엔비디아가 공개한 ‘실수해도 포기 안 하는 로봇’ [3]	aimatters	07.25	8210	3
627	“지금 좋아도 20년 후 손해”… AI가 신입 일자리 뺏으면 국가 경제성장 발목 잡힌다	aimatters	07.25	172	0
626	"내 목소리가 야동에?" 성우 생존을 위협하는 AI의 무단 목소리 복제	aimatters	07.25	158	0
625	구글 포토, AI 기반 '사진 리믹스'·'영상 변환' 기능 출시... 무료로 영상 변환 [4]	aimatters	07.24	428	0
624	유튜브, 쇼츠 이미지 영상으로 바꿔준다... 누구나 이미지로 쇼츠 제작 가능	aimatters	07.24	2860	4
623	트럼프 행정부, AI 성장 가속 위해 규제 완화… 中과 경쟁 본격화	aimatters	07.24	195	0
622	"파트너·동맹국, 美 통제 따라야 해"... 트럼프 행정부, 中 AI 칩 수출 차단 재추진	aimatters	07.24	188	0
621	테슬라, 전기차 판매 둔화로 실적 타격… AI·로보틱스로 전환 시동 [6]	aimatters	07.24	2791	0
620	구글, AI 오버뷰 월간 사용자 20억 명 돌파했지만 ‘자본 투자 확대’ 계획에 주가 하락	aimatters	07.24	188	0
뉴스	스테이씨 윤·수민, 그라운드도 접수! 시구·시타로 빛낸 서머퀸 클래스	디시트렌드	10:00