디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

ㅇㅇ(182.230) 2024.05.17 20:10:58
조회 283 추천 1 댓글 3
														

https://www.aitimes.com/news/articleView.html?idxno=159751

 



7ce88971b08307f739ed87e044ee7069405daaf0281a08a2b4a5f4a57de8a3a12f42



텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔다. 오픈AI와 구글이 각각 음성 인공지능(AI) 비서 'GPT-4o'와 '아스트라'를 공개한 지 고작 며칠 만이다.


벤처비트는 16일(현지시간) 아마존 웹 서비스(AWS) 연구진이 음성을 이헤ㅐ하고 응답할 수 있는 LLM에 대한 심각한 보안 결점을 지적하는 논문을 발표했다고 보도했다.


연구진은 스마트 스피커부터 AI 비서까지 음성 엔터페이스가 보편화됨에 따라 안전성을 보장하는 것이 중요해지고 있지만, LLM에 내장된 가드레일에도 불구하고 음성언어모델(Speech Language Model)이 적대적 공격에 매우 취약하다는 사실을 발견했다고 지적했다.


즉, 오디오 입력 시 약간의 교란을 통해 모델의 탈옥을 쉽게 유도할 수 있다는 설명이다.


연구진은 '투영 경사하강법(Projected Gradient Descent)'이라는 기술을 사용, 모델이 노골적인 폭력부터 증오심 표현까지 12가지 범주에 걸쳐 유해한 결과를 생성하는 데 성공했다고 전했다. 특히 성공률은 90%에 달했다고 강조했다.



7ce88971b08307f739ed87e045ee7068c268370ef4c6bb1f43aaf939b8b56fdd62



또 교차 모델 및 교차 프롬프트 공격과 같은 기술을 사용하는 '전송 공격(Transfer attacks)' 방법을 통해서는 10%의 평균 성공률을 기록했다고 밝혔다. 이는 한 모델에서 만들어진 오디오 공격이 직접적인 액세스 없이도 다른 모델로 전송되는 경우를 말한다.


수석 저자인 라그후비어 페리는 “다양한 모델 아키텍처에 걸쳐 이런 공격이 전달될 수 있다는 점은 현재 이런 시스템을 정렬하고 훈련하는 방법에 문제가 있음을 시사한다"라고 말했다.



7ce88971b08307f739ed87e042ee70681e215535e0a640c20ce483a504646a1139



AWS 연구진은 오디오 입력에 무작위 노이즈를 추가하는 '무작위 평활화(Randomized Smoothing)'라고 알려진 기술 등을 대책으로 제안했다. 실험에서는 이를 통해 공격 성공률이 크게 감소했다. 그러나 연구진은 완전한 해결책은 아니라고 경고했다.


페리 연구원은 "적의 공격에 방어하는 것은 일종의 군비 경쟁"이라며 “모델의 기능이 향상되며, 오용 가능성도 커졌다. 지속적인 안전 투자가 중요하다”라고 밝혔다.


실제로 연구에 활용된 음성 모델은 첨단 성능을 달성하기 위해 대화 데이터 학습을 거쳤으며, 실험 전 안전 및 유용성 벤치마크에서 모두 80% 이상을 달성했다.


이번 연구는 음성 AI 비서 도입 본격화를 앞두고 보안에 대한 문제를 미리 검토해야 한다는 경고로 등장했다.

연구의 공동 저자인 카트린 키르초프는 “우리는 음성 AI 기술의 변곡점에 와 있다"라며 "이는 사회에 이익을 줄 수 있는 엄청난 잠재력을 가지고 있지만, 책임감 있게 개발하지 않으면 해를 끼칠 수도 있다”라고 말했다.

자동등록방지

추천 비추천

1

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
488098 일반 그럼 걔가 잘했으면 [1] ㅇㅇ갤로그로 이동합니다. 06.07 290 5
488096 일반 출SAN율 때문에 나라 망한다 어쩐다하는데.. [5] 특이점특이점(14.55) 06.07 270 0
488095 일반 미라눈나 프론티어 곧 나온다고 했잖아요 [2] ㅇㅇ(1.210) 06.07 167 0
488093 일반 살면서 본 찌라시중에 젤 웃기네 [5] ㅇㅇ(175.214) 06.07 258 0
488092 일반 아일랜드라는 옛날영화 보는데 요한슨 개쩌네 [4] ㅇㅇ(118.34) 06.07 296 2
488091 일반 [뇌피셜 찌라시] 사만다 → GPT4.5 / 단일 신경망 → GPT5 [1] ㅇㅇ(221.167) 06.07 198 0
488090 일반 6월 13일에 큰 거 옴 [9] ㅇㅇ(125.191) 06.07 263 0
488089 일반 [찌라시] 찌라시에 따르자면 GPT5 출시일은 [5] ㅇㅇ(221.167) 06.07 452 3
488088 일반 트윗찌라시에 웰케 반응함 ㅇㅇ(112.186) 06.07 54 0
488087 일반 찌라시는 대부분 지미애플 미만잡임 [2] ㅇㅇ(112.163) 06.07 94 0
488086 일반 찌라시 공신력은 역시 지미럴 사과햄 뿐이냐 [2] ㅇㅇ(118.34) 06.07 118 0
488085 일반 올웨이즈 저새끼 요즘 자주보이지 않냐? ㅇㅇ갤로그로 이동합니다. 06.07 61 0
488084 일반 에이전트가 뭐임? [3] ㅇㅇ(39.122) 06.07 110 0
488083 일반 LMM 의 시대로의 개막 [5] ㅇㅇ(221.167) 06.07 282 0
488082 일반 그래서 카운트다운 쓰는 새끼 뭐함 [2] ㅇㅇ(39.125) 06.07 153 0
488081 일반 일러레갤 웃기노 [8] 도지500층갤로그로 이동합니다. 06.07 236 1
488080 일반 최신 찌라시) gpt5는 연말 / 프로젝트 폰노이만 진행중 [17] ㅇㅇ(211.214) 06.07 629 7
488078 일반 탈옥이라는 건 없다. 왜 ㅇㅇ(211.208) 06.07 72 0
488077 일반 GPT5를 배포하는 건 기다릴 수 있어 ㅇㅇ(119.202) 06.07 72 0
488076 일반 어우 신선한 공기들어오니 좋네 ㅎㅎ ㅇㅇ(58.124) 06.07 104 0
488075 일반 그래 이제앞뒤안가린다 다 같이 좆돼보자 ㅇㅇ갤로그로 이동합니다. 06.07 278 6
488074 일반 이새끼 반응만 봐도 예상 가기는 했음 ㅇㅇ(125.183) 06.07 214 0
488073 일반 GPT5 성능 이정도면 이해 가능함? ㄷㄷ [2] ㅇㅇ(211.179) 06.07 245 0
488072 일반 엔비디아가 애플 시총을 땄느니 어쩌니 [4] ㅇㅇ(118.235) 06.07 222 0
488071 일반 영상인식 기술은 절대 개발되면 안됨 [3] ㅇㅇ(172.226) 06.07 172 0
488070 일반 뤼튼 이새끼들은 업스테이지급 기술도 없음 ㅇㅇ(110.145) 06.07 181 0
488068 일반 아 내가 실베 보냈다 ㅋ . ㅋ ㅇㅇ갤로그로 이동합니다. 06.07 172 0
488067 정보/ 찌라시) 월요일날 gpt5 공개? [5] ㅇㅇ(118.33) 06.07 445 1
488066 일반 llm의 한계는 아이러니 하게도 그 구조적 문제가 아니고 [1] ㅇㅇ(110.145) 06.07 138 0
488065 일반 AI가 인류멸망 시킨다는데 WhiskyDelta갤로그로 이동합니다. 06.07 59 0
488064 일반 미개한 좆간놈들 우린 이미 특이점을 누리지! [3] ㅇㅇ(222.120) 06.07 152 0
488063 일반 지금 20대면 죽기전에 특이점 오냐 [5] ㅇㅇ(223.39) 06.07 182 0
488062 일반 빨리 영상 인식기술이 공개되야하는데 ㅇㅇ갤로그로 이동합니다. 06.07 40 0
488061 일반 최고의 경지 영크리에이터포에버갤로그로 이동합니다. 06.07 59 0
488060 일반 휴머노이드 보면 중국이 대안인가 싶다 [7] ㅇㅇ(218.147) 06.07 262 0
488059 토의 개미가 코끼리를 세뇌할 수가 있을까? [4] A.I.갤로그로 이동합니다. 06.07 115 1
488058 일반 스타십 저거 상용화는 언제쯤 될 거 같음? [2] ㅇㅇ(112.158) 06.07 92 0
488057 일반 특붕쿤들 요요요 불쌍한 ㅅ ㅐ끼들아 ㅋㅋㅋ [1] ㅇㅇ(211.184) 06.07 77 0
488056 일반 바벨탑이라고 생각하고 역사서대로 가면 3차 4차 대전이 제일 가능성있네 A.I.갤로그로 이동합니다. 06.07 83 0
488055 일반 제미나이는 그냥 딱 검색기라고 생각하고 씀 [2] ㅇㅇ(121.182) 06.07 121 1
488054 일반 gpt5 나오면 사과문제부터 풀게할거다 ㅇㅇ(118.235) 06.07 73 0
488053 일반 특이점에 대한 천벌은 사람 스스로가 불러오겠지 ㅇㅇ(1.249) 06.07 42 0
488052 일반 난 지수충임 집단린치갤로그로 이동합니다. 06.07 105 0
488051 일반 클로드 업뎃했냐? 뭔가 다른데 [1] ㅇㅇ(115.138) 06.07 155 0
488050 일반 알트만이 말의 수위를 점점 높이는데 이유가 뭘까? [5] ㅇㅇ(218.147) 06.07 370 0
488049 일반 천재들의 전쟁 보는 거 같아서 흥미진진함 [5] A.I.갤로그로 이동합니다. 06.07 182 0
488048 일반 특붕이들 이러다가 다 특부이치치되것노 ㅇㅇ(221.140) 06.07 79 0
488047 일반 선형충들을 왜 거부해왔는지 이제 알겠냐? [1] ㅇㅇ(121.161) 06.07 116 1
488046 일반 ai시장이 이렇게까지 hyped되있는데도 [12] ㅇㅇ(118.32) 06.07 259 2
488045 일반 혹시 인공지능 연관 트렌드 올라오는 피드나 커뮤니티 더 있을까요 ㅇㅇ(112.161) 06.07 34 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2