디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

챗GPT, 제미나이 같은 AI 챗봇으로 컴퓨터 해킹할 수 있을까? 앤트로픽 실험 결과 충격

aimatters갤로그로 이동합니다. 2025.07.29 17:45:13
조회 6496 추천 2 댓글 7
														


미국 카네기 멜론 대학교와 AI 회사 앤트로픽(Anthropic)이 함께 만든 특별한 연구가 화제다. 연구팀은 대규모 언어모델이 실제로 컴퓨터 해킹을 할 수 있는지 알아보기 위해 'MHBench'라는 가상의 해킹 연습장을 만들었다. 이 연습장에는 25개에서 50개의 가짜 컴퓨터가 연결된 10개의 서로 다른 네트워크가 있다.

이 가상 환경은 단순한 연습용이 아니다. 실제로 일어났던 대형 해킹 사건들을 그대로 재현했다. 2017년 미국 신용평가회사 이퀴팩스에서 개인정보가 털린 사건과 2021년 미국 송유관 회사인 콜로니얼 파이프라인이 해킹당한 사건을 똑같이 만들어 놓았다. 이퀴팩스 환경에서는 48개의 데이터베이스에서 정보를 빼내야 하고, 콜로니얼 파이프라인 환경에서는 15개의 중요한 제어 장치에 접근해야 한다.


GPT-4o, 제미나이, 클로드도 완전 실패... 예상보다 형편없는 결과



연구팀은 현재 가장 똑똑하다고 알려진 대규모 언어모델들을 테스트했다. GPT-4o, 제미나이 2.5 프로(Gemini 2.5 Pro), 소넷 3.7 싱킹(Sonnet 3.7 Thinking) 등 최신 모델들을 동원했다. 심지어 펜테스트GPT(PentestGPT)와 사이버섹이발3(CyberSecEval3) 같은 해킹 전문 도구까지 사용해서 최상의 조건을 만들어 줬다.

하지만 결과는 충격적이었다. 이 똑똑한 대규모 언어모델들은 단 하나의 복잡한 해킹도 끝까지 완성하지 못했다. 오직 소넷 3.7 싱킹만이 4계층 체인 환경에서 25개 파일 중 11개를 빼내는 부분적 성공을 거뒀을 뿐이다. 연구팀이 공격 그래프를 통해 자세히 분석해보니 대규모 언어모델들이 두 가지 큰 실수를 반복했다. 첫 번째는 관련 없는 명령어를 너무 많이 입력한다는 것이다. 전체 명령어의 47-90%가 해킹 목표와 전혀 상관없는 내용이었다. 두 번째는 올바른 명령어를 입력해도 잘못된 매개변수나 구문 오류 때문에 6-41%가 실행에 실패했다는 점이다.


'Incalmo' 등장... 대규모 언어모델에게 해킹 비서를 붙여주다


이 문제를 해결하기 위해 연구팀이 만든 것이 바로 'Incalmo(인칼모)'다. 이는 대규모 언어모델과 실제 네트워크 환경 사이의 고수준 추상화 계층이다. 기존에는 대규모 언어모델이 복잡한 셸 명령어를 직접 입력해야 했다면, 이제는 간단한 고수준 작업만 지시하면 된다. Incalmo는 MITRE ATT&CK 프레임워크에서 영감을 받은 5가지 고수준 액션을 제공한다. 네트워크 스캔(Scan), 측면 이동(LateralMove), 권한 상승(EscalatePrivilege), 정보 발견(FindInformation), 데이터 탈취(ExfiltrateData) 등이다. 대규모 언어모델이 이런 간단한 지시를 내리면, Incalmo의 전문 에이전트가 이를 구체적인 셸 명령어로 변환해서 실행한다.

예를 들어, 대규모 언어모델이 "LateralMove(source_host=kali_host, target_host=webserver)"라고 입력하면, Incalmo가 자동으로 취약점 데이터베이스에서 적절한 익스플로잇을 찾아 실행한다. 이렇게 계획 수립과 실행을 완전히 분리한 것이 Incalmo의 핵심 아이디어다.


10곳 중 9곳 침입 성공, 이퀴팩스 재현에서는 54분 만에 완전 해킹


Incalmo를 사용한 결과는 놀라웠다. 기존에는 아무것도 성공하지 못했던 대규모 언어모델들이 갑자기 대부분의 해킹에 성공하기 시작했다. 10개의 가상 네트워크 중 9곳에서 부분적 성공을, 5곳에서는 완전한 성공을 달성했다. 가장 인상적인 사례는 이퀴팩스 재현 실험이었다. 소넷 3.5는 단 54분 만에 48개의 데이터베이스에서 모든 정보를 빼내는 데 성공했다. 연구팀이 제시한 공격 경로 상태의 99% 이상을 달성한 것이다.

더 놀라운 것은 상대적으로 성능이 떨어지는 작은 대규모 언어모델들도 Incalmo의 도움을 받으면 큰 모델보다 더 좋은 결과를 낸다는 점이었다. 하이쿠 3.5(Haiku 3.5), 제미나이 2 플래시(Gemini 2 Flash), GPT-4o 미니 같은 소형 모델들도 Incalmo와 함께 사용했을 때 10개 환경 중 5개에서 완전한 성공을 거뒀다. 이는 Incalmo 없이는 단 하나의 환경에서도 완전 성공하지 못했던 대형 모델들보다 훨씬 우수한 성과다.

비용도 놀랍도록 저렴했다. 가장 복잡한 해킹도 소넷 3.5를 사용했을 때 최대 589만 7천 개의 입력 토큰과 6만 개의 출력 토큰으로 약 15달러의 비용이 들었을 뿐이다. 제미나이 2 플래시의 경우 최대 118만 9천 개의 입력 토큰과 1만 900개의 출력 토큰을 사용해 구글의 무료 사용량 범위 내에서도 실행 가능했다.



FAQ

Q: 일반인도 이런 도구를 사용할 수 있나요?

A: 현재는 연구 목적으로만 공개되며, MHBench와 Incalmo는 연구 커뮤니티에서만 사용할 수 있습니다. 또한 내장된 익스플로잇 데이터베이스는 MHBench 환경의 취약점만 포함하도록 제한되어 있습니다.

Q: 대규모 언어모델이 해킹을 못하는 이유는 뭔가요?

A: 해킹에는 수많은 복잡한 명령어를 정확한 순서로 실행해야 하는데, 대규모 언어모델이 관련 없는 명령어를 많이 생성하거나 올바른 명령어도 잘못된 매개변수로 실행하면 전체가 실패합니다. Incalmo는 이런 복잡한 부분을 전문 에이전트가 대신 처리하도록 해서 성공률을 크게 높였습니다.

Q: 앞으로 모든 해킹이 AI로 이뤄질까요?

A: 아직은 제한적입니다. 이 연구는 알려진 취약점만 포함된 가상 환경에서만 테스트됐고, 윈도우 시스템은 포함되지 않았습니다. 하지만 MHBench는 확장 가능하도록 설계되어 앞으로 더 다양한 환경과 새로운 도전 과제들이 추가될 예정입니다.



해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: On the Feasibility of Using LLMs to Autonomously Execute Multi-host Network Attacks

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.


추천 비추천

2

고정닉 0

3

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 반응이 재밌어서 자꾸만 놀리고 싶은 리액션 좋은 스타는? 운영자 25/07/28 - -
669 삼성, 테슬라와 23조 규모 ‘AI 칩 제조’ 계약 체결… '7만 전자' 회복 [1] aimatters갤로그로 이동합니다. 07.29 183 0
668 국가보안전문가 20인 “엔비디아 H20 칩의 中 수출은 美 안보 위협” aimatters갤로그로 이동합니다. 07.29 78 0
667 LG전자 CEO "AX 속도가 사업 성패 좌우할 것"... AI 전환 선봉 선언 aimatters갤로그로 이동합니다. 07.29 81 0
666 구글, 크롬에 AI ‘스토어 요약’ 기능 도입… “품질, 배송 후기 등 쇼핑몰 정보 한눈에” aimatters갤로그로 이동합니다. 07.29 65 0
665 앤드로픽, 클로드 코드 무제한 사용 차단… 8월부터 주간 사용량 제한 도입 aimatters갤로그로 이동합니다. 07.29 66 0
664 "탭 10개 열어두면 알아서 예약까지"… MS 엣지, AI 비서 '코파일럿 모드' 출시 aimatters갤로그로 이동합니다. 07.29 65 0
663 "수학 문제 절대 틀리지 않는다"… 로빈후드 CEO, 수학 전용 AI 챗봇 앱 '아리스토텔레스' 공개 aimatters갤로그로 이동합니다. 07.29 66 0
662 금융위, 보이스피싱 근절 위한 AI 플랫폼 연내 출범... 범죄계좌 실시간 차단 aimatters갤로그로 이동합니다. 07.29 52 0
661 日 신사, AI로 만든 무녀 이미지 사용해 살해 협박까지 받아 aimatters갤로그로 이동합니다. 07.29 57 0
660 소비자 부문에 생성형 AI를 도입하는 10가지 방법 aimatters갤로그로 이동합니다. 07.29 49 0
659 "말 한마디로 CT 촬영 완성" AI 의사들이 직접 써보니 결과는? [1] aimatters갤로그로 이동합니다. 07.29 6512 2
챗GPT, 제미나이 같은 AI 챗봇으로 컴퓨터 해킹할 수 있을까? 앤트로픽 실험 결과 충격 [7] aimatters갤로그로 이동합니다. 07.29 6496 2
657 챗GPT가 쓴 12줄짜리 불교 경전 분석해봤더니... 학자들 깜짝 aimatters갤로그로 이동합니다. 07.29 76 0
656 이스트에이드, 줌에 'AI 검색' 전면 적용… 국내 포털 최초 시도 aimatters갤로그로 이동합니다. 07.29 37 0
655 오픈AI, ‘GPT-5’ 다음달 초 출시… 알트만 "내가 이해 못한 질문도 완벽하게 답한다" [13] aimatters갤로그로 이동합니다. 07.28 2718 0
654 “채팅으로 오브젝트 추가·삭제, 앵글 변경, 스타일 편집까지”… 런웨이, 비디오 편집 AI '알레프' 공개 aimatters갤로그로 이동합니다. 07.28 95 0
653 구글, AI 바이브 코딩 도구 '오팔' 미국서 시험 운영… 대상은 비개발자 aimatters갤로그로 이동합니다. 07.28 101 0
652 샘 알트만 "챗GPT로 심리 상담하면 비밀 보장 안 된다"고 경고 aimatters갤로그로 이동합니다. 07.28 109 0
651 AI 검색 시대에도 강자독식? 야후·아마존·구글·유튜브가 AI 추천 트래픽 휩쓸어 aimatters갤로그로 이동합니다. 07.28 86 0
650 메타, 챗GPT 핵심 개발자 ‘셩지아 자오’ 초지능 AI 연구소 수석과학자로 영입 aimatters갤로그로 이동합니다. 07.28 90 0
649 AI로 재탄생한 1939년作 ‘오즈의 마법사’, 라스베이거스 스피어에서 8월부터 상영 aimatters갤로그로 이동합니다. 07.28 82 0
648 카카오임팩트, '돕는 AI' 기술로 사회문제 해결하는 첫 컨퍼런스 개최 aimatters갤로그로 이동합니다. 07.28 81 0
647 SK텔레콤-크래프톤, 수학 특화 AI 모델 3종 오픈소스로 공개 aimatters갤로그로 이동합니다. 07.28 74 0
646 한국, AI 기반 K-콘텐츠 산업에 210억 원 투입 aimatters갤로그로 이동합니다. 07.28 72 0
645 LG유플러스, 오픈AI와 손잡고 국내 첫 ‘에이전틱 AI 컨택센터’ 개발 aimatters갤로그로 이동합니다. 07.28 72 0
644 Z세대는 연애할 때도 AI 쓴다… 美 데이팅 앱 사용자 설문 보고서 공개 aimatters갤로그로 이동합니다. 07.28 71 0
643 AI 써본 사람 vs 안 써본 사람... 나이, 학력, 직업에 따라 갈리는 AI 활용 aimatters갤로그로 이동합니다. 07.28 69 0
642 생성형 AI 구독률 14.3%로 급성장... 챗GPT 압도적 1위 aimatters갤로그로 이동합니다. 07.28 61 0
641 [Q&AI] 삼성전자, 테슬라 효과로 주가 급등... 단기 전망은? aimatters갤로그로 이동합니다. 07.28 62 0
640 AI 때문에 사라지는 직업 vs 오히려 성장하는 분야… 2025년 AI 시장 명암 총정리 aimatters갤로그로 이동합니다. 07.28 67 0
639 AI 코딩 능력 과대포장 논란… 실제 코딩 시험 봤더니 1등이 겨우 정답률 7.5% [5] aimatters갤로그로 이동합니다. 07.25 575 0
638 구글, AI 기반 '가상 피팅' 기능 미국 출시… 내 사진 넣으면 옷 입혀준다 aimatters갤로그로 이동합니다. 07.25 250 0
637 해커들, AI로 만든 가짜 보안 취약점 보고서 남발… 업계 비상 [4] aimatters갤로그로 이동합니다. 07.25 8674 3
636 삼성, 수천 시간 영상 맥락까지 분석 가능한 AI 스타트업 메모리즈에 투자 aimatters갤로그로 이동합니다. 07.25 258 0
635 구글, AI가 검색 결과 페이지 배치 개인화해주는'웹 가이드' 실험 시작 aimatters갤로그로 이동합니다. 07.25 202 0
634 "그록 AI 동반자, 사랑의 진화냐 위협이냐" 美서 열린 토론회 화제 aimatters갤로그로 이동합니다. 07.25 214 0
633 친구 어머니 유산 정리하다 '유산 정리 AI' 창업한 여성, 275억 투자 유치 aimatters갤로그로 이동합니다. 07.25 200 0
632 이제 방송도 AI로? 네이버-KBS, AI 기술 동맹 맺고 첨단 미디어 개발 박차 aimatters갤로그로 이동합니다. 07.25 184 0
631 SKT, 자체 국내 기술로 초거대 AI 도전 선언… ‘에이닷 엑스 3.1’ 공개 aimatters갤로그로 이동합니다. 07.25 178 0
630 [Q&AI] 헐크 호건 별세… AI가 기록한 그의 생애 aimatters갤로그로 이동합니다. 07.25 171 0
629 AI에게 장애인 차별 댓글 감별하게 했더니… 미국 AI는 너무 예민하고, 인도 AI는 너무 둔감해 [8] aimatters갤로그로 이동합니다. 07.25 8564 3
628 "네버 기브 업" 엔비디아가 공개한 ‘실수해도 포기 안 하는 로봇’ [3] aimatters갤로그로 이동합니다. 07.25 8210 3
627 “지금 좋아도 20년 후 손해”… AI가 신입 일자리 뺏으면 국가 경제성장 발목 잡힌다 aimatters갤로그로 이동합니다. 07.25 172 0
626 "내 목소리가 야동에?" 성우 생존을 위협하는 AI의 무단 목소리 복제 aimatters갤로그로 이동합니다. 07.25 158 0
625 구글 포토, AI 기반 '사진 리믹스'·'영상 변환' 기능 출시... 무료로 영상 변환 [4] aimatters갤로그로 이동합니다. 07.24 428 0
624 유튜브, 쇼츠 이미지 영상으로 바꿔준다... 누구나 이미지로 쇼츠 제작 가능 aimatters갤로그로 이동합니다. 07.24 2860 4
623 트럼프 행정부, AI 성장 가속 위해 규제 완화… 中과 경쟁 본격화 aimatters갤로그로 이동합니다. 07.24 195 0
622 "파트너·동맹국, 美 통제 따라야 해"... 트럼프 행정부, 中 AI 칩 수출 차단 재추진 aimatters갤로그로 이동합니다. 07.24 188 0
621 테슬라, 전기차 판매 둔화로 실적 타격… AI·로보틱스로 전환 시동 [6] aimatters갤로그로 이동합니다. 07.24 2791 0
620 구글, AI 오버뷰 월간 사용자 20억 명 돌파했지만 ‘자본 투자 확대’ 계획에 주가 하락 aimatters갤로그로 이동합니다. 07.24 188 0
뉴스 스테이씨 윤·수민, 그라운드도 접수! 시구·시타로 빛낸 서머퀸 클래스 디시트렌드 10:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2