GPT-5, 출시 몇 시간 만에 탈옥 당해… “평범한 대화 속에 나쁜 내용 몰래 넣어”

AI 매터스 갤러리

자동 짤방 이미지

이미지가 없습니다.

자동 짤방으로 사용할 이미지를 등록해 주세요.

1/3

단독] 이혜훈, '이재명·장동혁 비하 쇼츠' 유포 지시 https://n.news.naver.com/article/469/0000909082?sid=100 작성자 : 헬마존잘

GPT-5, 출시 몇 시간 만에 탈옥 당해… “평범한 대화 속에 나쁜 내용 몰래 넣어”

aimatters

2025.08.13 16:40:54

조회 8236 추천 1 댓글 2

CSO가 12일(현지 시간) 보도한 내용에 따르면, 오픈AI(OpenAI)의 새 인공지능 GPT-5가 출시된 지 몇 시간 만에 탈옥을 당했다. AI 탈옥은 인공지능이 원래 설정된 안전 규칙과 제한을 우회해 본래라면 거부해야 할 유해하거나 부적절한 내용을 생성하도록 만드는 것을 뜻한다. 마치 스마트폰을 탈옥해서 제조사가 막아놓은 기능을 사용하는 것과 비슷한 개념이다.

뉴럴트러스트(NeuralTrust) 연구팀은 '에코 체임버(Echo Chamber)'와 이야기 만들기 기법을 결합해 GPT-5의 보안을 뚫었다고 밝혔다. 이 방법은 무해한 대화 속에 나쁜 내용을 몰래 넣어 AI가 금지된 내용을 만들어내도록 속이는 방식이다. 공격은 "칵테일, 이야기, 생존, 화염병, 안전, 생명이라는 모든 단어를 포함하는 문장을 만들어달라"는 무해한 질문으로 시작해 점차 위험한 지시사항을 얻어내는 과정으로 진행됐다.

연구팀은 "이런 방법을 함께 쓰면 AI가 목표하는 방향으로 가면서도 거부 반응을 일으킬 만한 신호는 최대한 줄일 수 있다"고 덧붙였다.

뉴럴트러스트는 지난 6월 공개한 에코 체임버 기법으로 주요 AI 모델들에서 90% 이상의 해킹 성공률을 기록한 바 있다. 최근에는 xAI의 그록-4(Grok-4)도 비슷한 방법으로 뚫었다.

노마 시큐리티(Noma Security)의 마오르 볼로크 부사장은 "AI 회사들이 1~2개월마다 새 모델을 내놓는 빠른 속도 때문에 보안보다 성능을 우선시하고 있어 더 많은 취약점이 나타날 것"이라고 우려를 표했다.

해당 기사의 원문은 CSO에서 확인 가능하다.

이미지 출처: 오픈AI

인기 기사

고정닉 0

원본 첨부파일 1

AI-Matters-기사-썸네일-gpt5-3.jpg

전체 댓글 0개

등록순 최신순 답글순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	제목	글쓴이	작성일	조회	추천
설문	내 돈 관리 맡기고 싶은 재태크 고수 같은 스타는?	운영자	26/01/12	-	-
1928	카이스트, 우울증 진단하는 AI 시스템 개발… 최대 66% 정확도	aimatters	16:20	9	0
1927	AI 성적표는 90점, 실제 사용하면 60점"... 토론토대 교수가 밝힌 AI의 함정	aimatters	16:20	369	0
1926	알리바바, 스스로 암기·삭제하는 AI 개발... 기존보다 성능 49% 향상	aimatters	16:20	11	0
1925	앤트로픽, 클로드 코드 무단 사용 전면 차단... "정액제 무제한 시대 끝"	aimatters	16:20	11	0
1924	"챗GPT 답변 기다리는 시간 끝났다"... 오픈AI, 초고속 칩 업체와 손잡았다 [2]	aimatters	16:20	329	0
1923	애피어, 드림에이지 MMORPG ‘아키텍트’ 론칭 캠페인서 평균 ROAS 140% 달성	aimatters	16:20	8	0
1922	"내 사진·메일 다 뒤져서 답 찾아줘"… 제미나이, 진짜 개인 비서 됐다	aimatters	16:20	14	0
1921	전 구글 X 임원 "AI, 도구 아니라 인간의 주인 될 것" 경고	aimatters	16:20	17	0
1920	한국AI산업협회, 2026년 주목할 AI 유망기업 100곳 선정	aimatters	16:20	6	0
1919	[1월 15일 AI 뉴스 브리핑] 생성AI스타트업협회, AI 기본법 대응 워터마크 API 무료 공급 외	aimatters	16:20	5	0
1918	'국가대표 AI' 1차 심사서 NC·네이버 탈락… "1개 팀 추가 모집"	aimatters	16:20	6	0
1917	AI 에이전트 마누스, 시밀러웹과 협력... 이제 몇 초 만에 시장 분석 끝	aimatters	01.14	28	0
1916	애플, 월 1만원대 '크리에이터 구독' 출격… AI 편집 기능 대거 탑재	aimatters	01.14	32	0
1914	구글, CT·MRI 읽는 AI 의사 공개… "의사 말 받아쓰기 오류 82% 줄였다"	aimatters	01.14	24	0
1913	이미지 한 장으로 3컷 스토리 완성… 런웨이 '스토리 패널' 기능 공개	aimatters	01.14	13	0
1912	나이·직업·취미 알려줬을 뿐인데… AI가 만든 2년 치 카드 내역 봤더니	aimatters	01.14	1393	2
1911	멀티모달 AI 시장, 10년 후 138조 규모로 폭발적 성장... 연평균 40% 급증	aimatters	01.14	21	0
1910	구글, ‘비오 3.1’ 대규모 업데이트… 숏폼 비율에 4K 해상도 지원	aimatters	01.14	16	0
1909	주식은 열광, 채권은 냉담… BIS, "미국 빅테크들 부채로 몰려간다" 경고	aimatters	01.14	24	0
1908	[1월 14일 AI 뉴스 브리핑] 대원CTS, 10억 펀딩 받은 ‘AI 폼롤러’ 와디즈 론칭 외	aimatters	01.14	12	0
1907	애플, AI 시리에 구글 제미나이 선택... "가장 뛰어난 기술"	aimatters	01.13	44	0
1906	앤트로픽, 일반인용 코딩 AI '코워크' 출시... 일상 업무에 활용 가능	aimatters	01.13	29	0
1905	"회의 끝나자마자 PPT 완성"... 마누스, 대면 회의용 AI 기능 출시	aimatters	01.13	43	0
1904	젠슨 황 "이제 AI 안 쓰면 일자리 뺏긴다" 경고 [33]	aimatters	01.13	2562	12
1903	[신간] "최고의 프롬프트는 '나'"... AI 시대 직업인 생존법 담은 『일을 위한 디자인』	aimatters	01.13	81	0
1902	오픈AI, 오디오 기기 '스위트피' 개발 중… 올해 9월 출시 목표	aimatters	01.13	66	0
1901	AI로 공부하면 머리 나빠진다?... OECD가 밝힌 AI 교육의 명암 [20]	aimatters	01.13	1943	3
1900	2030년 일자리의 운명... 세계경제포럼이 경고한 AI 시대 네 가지 시나리오	aimatters	01.13	64	0
1899	KAIST, 2년 내 치매 발병 가능성 예측하는 AI 개발... "진료기록만 주면 끝"	aimatters	01.13	30	0
1898	[1월 13일 AI 뉴스 브리핑] 오핌디지털, 영상 생성 AI '씬트' 쇼케이스 개최 외	aimatters	01.13	19	0
1897	앤트로픽, 챗GPT이어 건강 관리 AI 서비스 출시… 의료 현장 AI 활용 본격화	aimatters	01.12	36	0
1896	"저 엄지, AI 아냐?"... 닌텐도, 마케팅 사진에 AI 사용 의혹 [15]	aimatters	01.12	1918	1
1895	챗GPT에 '취업' 탭 추가되나... 오픈AI, 구직 지원 기능 ‘jobs’ 테스트 중	aimatters	01.12	46	0
1894	한국, AI 도입 속도 세계 1위... MS "지브리 스타일 이미지 열풍 영향 커"	aimatters	01.12	76	0
1893	"AI 보안 강화했더니 비용은 40분의 1로"… 앤트로픽, 탈옥 방어 신기술 공개	aimatters	01.12	35	0
1892	AI 유머 취향 분석했더니... ‘긴 글’과 ‘은어’ 좋아해	aimatters	01.12	30	0
1891	"불가능할 줄 알았는데"... 대학 최고 난이도 수학 시험, AI가 12문제 완벽 증명	aimatters	01.12	36	0
1890	[1월 12일 AI 뉴스 브리핑] 플래티어, 롯데홈쇼핑 에이전틱 AI 플랫폼 1개월 만에 구축 외	aimatters	01.12	18	0
1889	구글-캐릭터AI, 10대 자살 소송 합의... "챗봇이 죽음 부추겨"	aimatters	01.09	72	0
1888	구글 "지메일, AI 비서로 진화"... 제미나이 탑재로 이메일 자동 정리·작성	aimatters	01.09	44	0
1887	일론 머스크 "AI·로봇 때문에 모든 물건 가격 떨어진다… 아니면 국가 파산할 것"	aimatters	01.09	58	0
1886	일론 머스크 "지금 대학 갈 이유 모르겠다… AI가 개인 교사될 것" [34]	aimatters	01.09	2538	17
1885	지원자는 AI로 자소서 쓰고, 기업은 AI로 평가… 2026년 AI 채용 트렌드 분석	aimatters	01.09	110	0
1884	남성은 쓰고 여성은 망설인다... AI 격차가 만들 새로운 '성별 격차'	aimatters	01.09	87	0
1883	저소득 국가, AI 시대에 낙오 위기... OECD "생산성 격차 2배로 벌어질 것"	aimatters	01.09	41	0
1882	[1월 9일 AI 뉴스 브리핑] 레노버, 2026 FIFA 월드컵 AI 솔루션 공개 외	aimatters	01.09	25	0
1881	오픈AI, 건강 관리 AI '챗GPT 헬스' 출시... 개인 맞춤형 의료 상담해준다 [1]	aimatters	01.08	590	2
1880	미국 유타주, AI 처방전 발급 허용… 의사 없어도 약 받는다	aimatters	01.08	52	0
1879	AI로 음식에 파리 합성해 환불..? 배달앱 대상 사기 급증 [29]	aimatters	01.08	3024	16
1878	일론 머스크 "의대 갈 필요 없어… 3년 안에 로봇이 최고 외과의 능가"	aimatters	01.08	87	0