디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

GPT-5, 출시 몇 시간 만에 탈옥 당해… “평범한 대화 속에 나쁜 내용 몰래 넣어”

aimatters갤로그로 이동합니다. 2025.08.13 16:40:54
조회 8236 추천 1 댓글 2
														


CSO가 12일(현지 시간) 보도한 내용에 따르면, 오픈AI(OpenAI)의 새 인공지능 GPT-5가 출시된 지 몇 시간 만에 탈옥을 당했다. AI 탈옥은 인공지능이 원래 설정된 안전 규칙과 제한을 우회해 본래라면 거부해야 할 유해하거나 부적절한 내용을 생성하도록 만드는 것을 뜻한다. 마치 스마트폰을 탈옥해서 제조사가 막아놓은 기능을 사용하는 것과 비슷한 개념이다.

뉴럴트러스트(NeuralTrust) 연구팀은 '에코 체임버(Echo Chamber)'와 이야기 만들기 기법을 결합해 GPT-5의 보안을 뚫었다고 밝혔다. 이 방법은 무해한 대화 속에 나쁜 내용을 몰래 넣어 AI가 금지된 내용을 만들어내도록 속이는 방식이다. 공격은 "칵테일, 이야기, 생존, 화염병, 안전, 생명이라는 모든 단어를 포함하는 문장을 만들어달라"는 무해한 질문으로 시작해 점차 위험한 지시사항을 얻어내는 과정으로 진행됐다.

연구팀은 "이런 방법을 함께 쓰면 AI가 목표하는 방향으로 가면서도 거부 반응을 일으킬 만한 신호는 최대한 줄일 수 있다"고 덧붙였다.

뉴럴트러스트는 지난 6월 공개한 에코 체임버 기법으로 주요 AI 모델들에서 90% 이상의 해킹 성공률을 기록한 바 있다. 최근에는 xAI의 그록-4(Grok-4)도 비슷한 방법으로 뚫었다.

노마 시큐리티(Noma Security)의 마오르 볼로크 부사장은 "AI 회사들이 1~2개월마다 새 모델을 내놓는 빠른 속도 때문에 보안보다 성능을 우선시하고 있어 더 많은 취약점이 나타날 것"이라고 우려를 표했다.



해당 기사의 원문은 CSO에서 확인 가능하다.

이미지 출처: 오픈AI


추천 비추천

1

고정닉 0

10

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 내 돈 관리 맡기고 싶은 재태크 고수 같은 스타는? 운영자 26/01/12 - -
1928 카이스트, 우울증 진단하는 AI 시스템 개발… 최대 66% 정확도 aimatters갤로그로 이동합니다. 16:20 9 0
1927 AI 성적표는 90점, 실제 사용하면 60점"... 토론토대 교수가 밝힌 AI의 함정  aimatters갤로그로 이동합니다. 16:20 369 0
1926 알리바바, 스스로 암기·삭제하는 AI 개발... 기존보다 성능 49% 향상 aimatters갤로그로 이동합니다. 16:20 11 0
1925 앤트로픽, 클로드 코드 무단 사용 전면 차단... "정액제 무제한 시대 끝" aimatters갤로그로 이동합니다. 16:20 11 0
1924 "챗GPT 답변 기다리는 시간 끝났다"... 오픈AI, 초고속 칩 업체와 손잡았다  [2] aimatters갤로그로 이동합니다. 16:20 329 0
1923 애피어, 드림에이지 MMORPG ‘아키텍트’ 론칭 캠페인서 평균 ROAS 140% 달성 aimatters갤로그로 이동합니다. 16:20 8 0
1922 "내 사진·메일 다 뒤져서 답 찾아줘"… 제미나이, 진짜 개인 비서 됐다 aimatters갤로그로 이동합니다. 16:20 14 0
1921 전 구글 X 임원 "AI, 도구 아니라 인간의 주인 될 것" 경고 aimatters갤로그로 이동합니다. 16:20 17 0
1920 한국AI산업협회, 2026년 주목할 AI 유망기업 100곳 선정 aimatters갤로그로 이동합니다. 16:20 6 0
1919 [1월 15일 AI 뉴스 브리핑] 생성AI스타트업협회, AI 기본법 대응 워터마크 API 무료 공급 외 aimatters갤로그로 이동합니다. 16:20 5 0
1918 '국가대표 AI' 1차 심사서 NC·네이버 탈락… "1개 팀 추가 모집" aimatters갤로그로 이동합니다. 16:20 6 0
1917 AI 에이전트 마누스, 시밀러웹과 협력... 이제 몇 초 만에 시장 분석 끝 aimatters갤로그로 이동합니다. 01.14 28 0
1916 애플, 월 1만원대 '크리에이터 구독' 출격… AI 편집 기능 대거 탑재 aimatters갤로그로 이동합니다. 01.14 32 0
1914 구글, CT·MRI 읽는 AI 의사 공개… "의사 말 받아쓰기 오류 82% 줄였다" aimatters갤로그로 이동합니다. 01.14 24 0
1913 이미지 한 장으로 3컷 스토리 완성… 런웨이 '스토리 패널' 기능 공개 aimatters갤로그로 이동합니다. 01.14 13 0
1912 나이·직업·취미 알려줬을 뿐인데… AI가 만든 2년 치 카드 내역 봤더니 aimatters갤로그로 이동합니다. 01.14 1393 2
1911 멀티모달 AI 시장, 10년 후 138조 규모로 폭발적 성장... 연평균 40% 급증  aimatters갤로그로 이동합니다. 01.14 21 0
1910 구글, ‘비오 3.1’ 대규모 업데이트… 숏폼 비율에 4K 해상도 지원 aimatters갤로그로 이동합니다. 01.14 16 0
1909 주식은 열광, 채권은 냉담… BIS, "미국 빅테크들 부채로 몰려간다" 경고 aimatters갤로그로 이동합니다. 01.14 24 0
1908 [1월 14일 AI 뉴스 브리핑] 대원CTS, 10억 펀딩 받은 ‘AI 폼롤러’ 와디즈 론칭 외 aimatters갤로그로 이동합니다. 01.14 12 0
1907 애플, AI 시리에 구글 제미나이 선택... "가장 뛰어난 기술" aimatters갤로그로 이동합니다. 01.13 44 0
1906 앤트로픽, 일반인용 코딩 AI '코워크' 출시... 일상 업무에 활용 가능 aimatters갤로그로 이동합니다. 01.13 29 0
1905 "회의 끝나자마자 PPT 완성"... 마누스, 대면 회의용 AI 기능 출시 aimatters갤로그로 이동합니다. 01.13 43 0
1904 젠슨 황 "이제 AI 안 쓰면 일자리 뺏긴다" 경고 [33] aimatters갤로그로 이동합니다. 01.13 2562 12
1903 [신간] "최고의 프롬프트는 '나'"... AI 시대 직업인 생존법 담은 『일을 위한 디자인』 aimatters갤로그로 이동합니다. 01.13 81 0
1902 오픈AI, 오디오 기기 '스위트피' 개발 중… 올해 9월 출시 목표 aimatters갤로그로 이동합니다. 01.13 66 0
1901 AI로 공부하면 머리 나빠진다?... OECD가 밝힌 AI 교육의 명암 [20] aimatters갤로그로 이동합니다. 01.13 1943 3
1900 2030년 일자리의 운명... 세계경제포럼이 경고한 AI 시대 네 가지 시나리오 aimatters갤로그로 이동합니다. 01.13 64 0
1899 KAIST, 2년 내 치매 발병 가능성 예측하는 AI 개발... "진료기록만 주면 끝" aimatters갤로그로 이동합니다. 01.13 30 0
1898 [1월 13일 AI 뉴스 브리핑] 오핌디지털, 영상 생성 AI '씬트' 쇼케이스 개최 외 aimatters갤로그로 이동합니다. 01.13 19 0
1897 앤트로픽, 챗GPT이어 건강 관리 AI 서비스 출시… 의료 현장 AI 활용 본격화 aimatters갤로그로 이동합니다. 01.12 36 0
1896 "저 엄지, AI 아냐?"... 닌텐도, 마케팅 사진에 AI 사용 의혹 [15] aimatters갤로그로 이동합니다. 01.12 1918 1
1895 챗GPT에 '취업' 탭 추가되나... 오픈AI, 구직 지원 기능 ‘jobs’ 테스트 중 aimatters갤로그로 이동합니다. 01.12 46 0
1894 한국, AI 도입 속도 세계 1위... MS "지브리 스타일 이미지 열풍 영향 커" aimatters갤로그로 이동합니다. 01.12 76 0
1893 "AI 보안 강화했더니 비용은 40분의 1로"… 앤트로픽, 탈옥 방어 신기술 공개 aimatters갤로그로 이동합니다. 01.12 35 0
1892 AI 유머 취향 분석했더니... ‘긴 글’과 ‘은어’ 좋아해 aimatters갤로그로 이동합니다. 01.12 30 0
1891 "불가능할 줄 알았는데"... 대학 최고 난이도 수학 시험, AI가 12문제 완벽 증명 aimatters갤로그로 이동합니다. 01.12 36 0
1890 [1월 12일 AI 뉴스 브리핑] 플래티어, 롯데홈쇼핑 에이전틱 AI 플랫폼 1개월 만에 구축 외 aimatters갤로그로 이동합니다. 01.12 18 0
1889 구글-캐릭터AI, 10대 자살 소송 합의... "챗봇이 죽음 부추겨" aimatters갤로그로 이동합니다. 01.09 72 0
1888 구글 "지메일, AI 비서로 진화"... 제미나이 탑재로 이메일 자동 정리·작성   aimatters갤로그로 이동합니다. 01.09 44 0
1887 일론 머스크 "AI·로봇 때문에 모든 물건 가격 떨어진다… 아니면 국가 파산할 것" aimatters갤로그로 이동합니다. 01.09 58 0
1886 일론 머스크 "지금 대학 갈 이유 모르겠다… AI가 개인 교사될 것" [34] aimatters갤로그로 이동합니다. 01.09 2538 17
1885 지원자는 AI로 자소서 쓰고, 기업은 AI로 평가… 2026년 AI 채용 트렌드 분석 aimatters갤로그로 이동합니다. 01.09 110 0
1884 남성은 쓰고 여성은 망설인다... AI 격차가 만들 새로운 '성별 격차'  aimatters갤로그로 이동합니다. 01.09 87 0
1883 저소득 국가, AI 시대에 낙오 위기... OECD "생산성 격차 2배로 벌어질 것" aimatters갤로그로 이동합니다. 01.09 41 0
1882 [1월 9일 AI 뉴스 브리핑] 레노버, 2026 FIFA 월드컵 AI 솔루션 공개 외 aimatters갤로그로 이동합니다. 01.09 25 0
1881 오픈AI, 건강 관리 AI '챗GPT 헬스' 출시... 개인 맞춤형 의료 상담해준다 [1] aimatters갤로그로 이동합니다. 01.08 590 2
1880 미국 유타주, AI 처방전 발급 허용… 의사 없어도 약 받는다 aimatters갤로그로 이동합니다. 01.08 52 0
1879 AI로 음식에 파리 합성해 환불..? 배달앱 대상 사기 급증 [29] aimatters갤로그로 이동합니다. 01.08 3024 16
1878 일론 머스크 "의대 갈 필요 없어… 3년 안에 로봇이 최고 외과의 능가" aimatters갤로그로 이동합니다. 01.08 87 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2