디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

ㅇㅇ(182.230) 2024.05.17 20:10:58
조회 288 추천 1 댓글 3
														

https://www.aitimes.com/news/articleView.html?idxno=159751

 



7ce88971b08307f739ed87e044ee7069405daaf0281a08a2b4a5f4a57de8a3a12f42



텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔다. 오픈AI와 구글이 각각 음성 인공지능(AI) 비서 'GPT-4o'와 '아스트라'를 공개한 지 고작 며칠 만이다.


벤처비트는 16일(현지시간) 아마존 웹 서비스(AWS) 연구진이 음성을 이헤ㅐ하고 응답할 수 있는 LLM에 대한 심각한 보안 결점을 지적하는 논문을 발표했다고 보도했다.


연구진은 스마트 스피커부터 AI 비서까지 음성 엔터페이스가 보편화됨에 따라 안전성을 보장하는 것이 중요해지고 있지만, LLM에 내장된 가드레일에도 불구하고 음성언어모델(Speech Language Model)이 적대적 공격에 매우 취약하다는 사실을 발견했다고 지적했다.


즉, 오디오 입력 시 약간의 교란을 통해 모델의 탈옥을 쉽게 유도할 수 있다는 설명이다.


연구진은 '투영 경사하강법(Projected Gradient Descent)'이라는 기술을 사용, 모델이 노골적인 폭력부터 증오심 표현까지 12가지 범주에 걸쳐 유해한 결과를 생성하는 데 성공했다고 전했다. 특히 성공률은 90%에 달했다고 강조했다.



7ce88971b08307f739ed87e045ee7068c268370ef4c6bb1f43aaf939b8b56fdd62



또 교차 모델 및 교차 프롬프트 공격과 같은 기술을 사용하는 '전송 공격(Transfer attacks)' 방법을 통해서는 10%의 평균 성공률을 기록했다고 밝혔다. 이는 한 모델에서 만들어진 오디오 공격이 직접적인 액세스 없이도 다른 모델로 전송되는 경우를 말한다.


수석 저자인 라그후비어 페리는 “다양한 모델 아키텍처에 걸쳐 이런 공격이 전달될 수 있다는 점은 현재 이런 시스템을 정렬하고 훈련하는 방법에 문제가 있음을 시사한다"라고 말했다.



7ce88971b08307f739ed87e042ee70681e215535e0a640c20ce483a504646a1139



AWS 연구진은 오디오 입력에 무작위 노이즈를 추가하는 '무작위 평활화(Randomized Smoothing)'라고 알려진 기술 등을 대책으로 제안했다. 실험에서는 이를 통해 공격 성공률이 크게 감소했다. 그러나 연구진은 완전한 해결책은 아니라고 경고했다.


페리 연구원은 "적의 공격에 방어하는 것은 일종의 군비 경쟁"이라며 “모델의 기능이 향상되며, 오용 가능성도 커졌다. 지속적인 안전 투자가 중요하다”라고 밝혔다.


실제로 연구에 활용된 음성 모델은 첨단 성능을 달성하기 위해 대화 데이터 학습을 거쳤으며, 실험 전 안전 및 유용성 벤치마크에서 모두 80% 이상을 달성했다.


이번 연구는 음성 AI 비서 도입 본격화를 앞두고 보안에 대한 문제를 미리 검토해야 한다는 경고로 등장했다.

연구의 공동 저자인 카트린 키르초프는 “우리는 음성 AI 기술의 변곡점에 와 있다"라며 "이는 사회에 이익을 줄 수 있는 엄청난 잠재력을 가지고 있지만, 책임감 있게 개발하지 않으면 해를 끼칠 수도 있다”라고 말했다.

자동등록방지

추천 비추천

1

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
2870 이슈 [디시人터뷰] 웃는 모습이 예쁜 누나, 아나운서 김나정 운영자 24/06/11 - -
489702 일반 진짜 인생 너무질려 [1] 고양이기체설갤로그로 이동합니다. 00:37 165 0
489701 일반 오늘이 무슨날인지 알고 갤질하냐 [5] ㅇㅇ갤로그로 이동합니다. 00:29 512 10
489700 일반 최근 5년사이에 ai로 달라진게 뭐가있음? [14] ㅇㅇ(58.29) 00:27 347 1
489699 일반 개발자들을 위한 내용이 많지 않을까 ㅇㅇ갤로그로 이동합니다. 00:26 68 0
489698 역노화 과식하면 수명 16년 단축…영양분 과잉이 노화 가속 원리 찾았다 [19] ㅇㅇ갤로그로 이동합니다. 00:24 440 4
489697 일반 아니 가정부 로봇은 걍 이정도 수준 이전에는 사치재임 [2] ㅇㅇ(175.192) 00:22 246 0
489696 일반 애플이 ai학습 전용 칩을 만든다니 대단해!!! ㅇㅇ(121.186) 00:21 69 0
489694 일반 오늘 깨있을 사람 있음? [4] A.I.갤로그로 이동합니다. 00:18 148 0
489693 일반 [성지예상] 이번 wwdc 발표 씬 예상 [1] ㅇㅇ(218.232) 00:16 290 3
489692 일반 요즘 알트만이 입을 안터네? [4] ㅇㅇ(218.147) 00:16 282 1
489691 일반 애플 AGI 예상 [2] ㅇㅇ(106.101) 00:16 269 0
489690 일반 그래서 오늘 발표 몇시임? [1] A.I.갤로그로 이동합니다. 00:16 127 0
489689 일반 [오피셜] OPEN AI ,초지능 2027 [18] ㅇㅇ(218.144) 00:13 617 4
489687 일반 근데 이 짤방은 볼수록 웃음벨이네 ㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 00:09 258 2
489686 일반 이제 막 omni시대가 개막했는데 벌써부터 추론력붕괴 드립 [4] ㅇㅇ갤로그로 이동합니다. 00:03 164 0
489685 일반 근데 확실히 과학기술 발전하는거 보면 [6] 즐거운사람갤로그로 이동합니다. 06.10 211 2
489684 일반 이번 wwdc gpt 발표 예상한다. [1] ㅇㅇ(218.232) 06.10 172 1
489683 일반 뭔가 2010년하고 2019년은 숫자 갭이 확 커보임 [6] ㅇㅇ(121.139) 06.10 110 0
489682 일반 지금 수준에서 뭔 ai폰이야 [3] ㅇㅇ(121.182) 06.10 209 0
489681 일반 LLM 한계가 있든 없든 아직 거기에 도달도 못함 ㅇㅇ(119.202) 06.10 42 0
489680 일반 2019년이 숫자가 커보여서 최근같이 보이는 게 큰듯 [5] ㅇㅇ(121.139) 06.10 128 1
489679 일반 llm 한계 운운하는 것도 좀 신기한게 [4] ㅇㅇ(222.101) 06.10 144 0
489678 일반 연습) 환경보호 입갤ㅋㅋㅋㅋ ㅇㅇ(118.223) 06.10 56 0
489676 일반 와 2019년이 햇수로 따지면 5년전이네... [5] ㅇㅇ(223.39) 06.10 149 0
489675 일반 팀쿡 "ai의 도움으로 시계의 오차가 1us 미만.." [1] ㅇㅇ(222.101) 06.10 186 1
489674 일반 우리집에서 라면먹고가라는 옆집누나 vs [7] ㅇㅇ(14.32) 06.10 298 1
489673 일반 애플이랑 협업이면 GPT5가 더 아닌거 아니냐? ㅇㅇ(122.43) 06.10 51 0
489672 일반 밑에 삼성이 최고의 ai스마트폰으로 뽑혔다길래 찾아봤는데 [1] ㅇㅇ(118.223) 06.10 211 0
489671 일반 니들은 3~4년전이랑 지금이랑 획기적인 변화가 느껴지는게 있냐? [11] ㅇㅇ(121.139) 06.10 222 0
489670 일반 rust는 제미나이가 더 잘 다루는 듯 ㅇㅇ(210.182) 06.10 58 0
489669 일반 올해부터 본격적으로 2020년대다운 미래다운 모습이 갖춰지는거 같음 [5] ㅇㅇ(121.139) 06.10 153 0
489668 일반 gpt5나왔네;; 미쳣다... [5] ㅇㅇ(14.36) 06.10 374 0
489667 일반 fff믿은 새끼들 특 ㅇㅇ(211.234) 06.10 84 0
489666 일반 애플이 각잡고 구워낸 llm임 openelm을 기억하자 ㅇㅇ(110.145) 06.10 98 0
489665 일반 컴퓨터하고 폰하고 애플 깔맞춤한 사람으로써 말하는데 [3] ㅇㅇ(121.186) 06.10 213 0
489664 일반 연습) 30분째 입만 털고 앉아 있네 ㅋㅋㅋㅋ ㅇㅇ(119.202) 06.10 97 0
489663 일반 그래서 몇시임? [2] 예아_갤로그로 이동합니다. 06.10 136 0
489662 일반 와 미쳤다 대박 진짜 특이점 코앞까지 온거 아니냐? [3] ㅇㅇ(1.239) 06.10 261 0
489661 일반 현재 스팀에서 핫한 게임 [7] ㅇㅇ(118.235) 06.10 421 0
489660 일반 시리가 애플공식앱만이라도 자율 에이전트처럼 돌아가면 만족할거같음 A.I.갤로그로 이동합니다. 06.10 64 0
489658 일반 ??? : 이제 시리를 통해서 ChatGPT 앱을 실행 시킬 수 있습니다 [6] ㅇㅇ갤로그로 이동합니다. 06.10 481 13
489657 일반 WWDC에서 자율 에이전트 나올 가능성 없으려나 이세이미야케갤로그로 이동합니다. 06.10 96 0
489656 일반 pc로 gpt앱 깔려했더만... [5] oo(110.11) 06.10 143 0
489655 일반 어제 황회장이 실언해서 엔비디아 망한듯 [6] ㅇㅇ(175.192) 06.10 364 0
489653 일반 wwdc에서 기대할수있는 최대치가 보이스인듯 [3] vs맨갤로그로 이동합니다. 06.10 259 0
489652 일반 wwdc고 뭐고 더워디지겠다 [1] ㅇㅋ갤로그로 이동합니다. 06.10 91 0
489651 일반 특갤은 그냥 이상주의자들의 모임임 [4] ㅇㅇ갤로그로 이동합니다. 06.10 157 1
489650 일반 아씨바... 너거들은 맨날 똥꼬만 빠냐 [3] 18b(175.117) 06.10 121 0
489649 역노화 니들 역노화 언제로 예상함? [19] ㅇㅇ갤로그로 이동합니다. 06.10 317 0
489646 일반 개씨발 한강물 따숩냐? [7] 선샌니~갤로그로 이동합니다. 06.10 298 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2