디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

ㅇㅇ(182.230) 2024.05.17 20:10:58
조회 281 추천 1 댓글 3
														

https://www.aitimes.com/news/articleView.html?idxno=159751

 



7ce88971b08307f739ed87e044ee7069405daaf0281a08a2b4a5f4a57de8a3a12f42



텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔다. 오픈AI와 구글이 각각 음성 인공지능(AI) 비서 'GPT-4o'와 '아스트라'를 공개한 지 고작 며칠 만이다.


벤처비트는 16일(현지시간) 아마존 웹 서비스(AWS) 연구진이 음성을 이헤ㅐ하고 응답할 수 있는 LLM에 대한 심각한 보안 결점을 지적하는 논문을 발표했다고 보도했다.


연구진은 스마트 스피커부터 AI 비서까지 음성 엔터페이스가 보편화됨에 따라 안전성을 보장하는 것이 중요해지고 있지만, LLM에 내장된 가드레일에도 불구하고 음성언어모델(Speech Language Model)이 적대적 공격에 매우 취약하다는 사실을 발견했다고 지적했다.


즉, 오디오 입력 시 약간의 교란을 통해 모델의 탈옥을 쉽게 유도할 수 있다는 설명이다.


연구진은 '투영 경사하강법(Projected Gradient Descent)'이라는 기술을 사용, 모델이 노골적인 폭력부터 증오심 표현까지 12가지 범주에 걸쳐 유해한 결과를 생성하는 데 성공했다고 전했다. 특히 성공률은 90%에 달했다고 강조했다.



7ce88971b08307f739ed87e045ee7068c268370ef4c6bb1f43aaf939b8b56fdd62



또 교차 모델 및 교차 프롬프트 공격과 같은 기술을 사용하는 '전송 공격(Transfer attacks)' 방법을 통해서는 10%의 평균 성공률을 기록했다고 밝혔다. 이는 한 모델에서 만들어진 오디오 공격이 직접적인 액세스 없이도 다른 모델로 전송되는 경우를 말한다.


수석 저자인 라그후비어 페리는 “다양한 모델 아키텍처에 걸쳐 이런 공격이 전달될 수 있다는 점은 현재 이런 시스템을 정렬하고 훈련하는 방법에 문제가 있음을 시사한다"라고 말했다.



7ce88971b08307f739ed87e042ee70681e215535e0a640c20ce483a504646a1139



AWS 연구진은 오디오 입력에 무작위 노이즈를 추가하는 '무작위 평활화(Randomized Smoothing)'라고 알려진 기술 등을 대책으로 제안했다. 실험에서는 이를 통해 공격 성공률이 크게 감소했다. 그러나 연구진은 완전한 해결책은 아니라고 경고했다.


페리 연구원은 "적의 공격에 방어하는 것은 일종의 군비 경쟁"이라며 “모델의 기능이 향상되며, 오용 가능성도 커졌다. 지속적인 안전 투자가 중요하다”라고 밝혔다.


실제로 연구에 활용된 음성 모델은 첨단 성능을 달성하기 위해 대화 데이터 학습을 거쳤으며, 실험 전 안전 및 유용성 벤치마크에서 모두 80% 이상을 달성했다.


이번 연구는 음성 AI 비서 도입 본격화를 앞두고 보안에 대한 문제를 미리 검토해야 한다는 경고로 등장했다.

연구의 공동 저자인 카트린 키르초프는 “우리는 음성 AI 기술의 변곡점에 와 있다"라며 "이는 사회에 이익을 줄 수 있는 엄청난 잠재력을 가지고 있지만, 책임감 있게 개발하지 않으면 해를 끼칠 수도 있다”라고 말했다.

자동등록방지

추천 비추천

1

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
487941 일반 올해는 gpt5 없는줄 알아라 ㅇㅇ(223.38) 09:00 128 1
487940 일반 애초에 기대를 하니까 배신을 당하는거다 ㅇㅇ(220.116) 08:54 77 1
487939 일반 OpenAI 새 트윗 ㅇㅇ(121.134) 08:52 431 1
487938 일반 챗 지피티 보이스 모드 지금 되는건가요? [7] ㅇㅇ(180.69) 08:48 238 0
487937 일반 gpt 유료구독 3시간 제한 다 쓰면 파일분석도 막히는 거임? [2] ㅇㅇ(118.217) 08:47 100 0
487936 일반 안나올 수 있긴한데 입은 왤케 많이 터는거냐 ㅇㅇ(112.161) 08:43 70 0
487935 일반 6일 은 아무 소스가 없었는데 왜 혼자 기대 했다가 실망 ㅋㅋ [4] ㅇㅇ(218.154) 08:37 201 1
487934 일반 걍 어찌됐건 oai는 약속 어긴거임 [16] ㅇㅇ(118.235) 08:36 545 12
487933 일반 존버 915일차 alphaca갤로그로 이동합니다. 08:36 51 0
487932 일반 qwen72b 벤치마크 엄청남데 ㅇㅇ(218.154) 08:33 102 0
487931 일반 애플 개발자회까지 사만다 기다려야되네 ㅇㅇ(223.38) 08:29 52 0
487930 일반 ㅂㅅ들 좀 진득하게 기다려라 oai뜻도 모르노 [1] ㅇㅇ(118.40) 08:06 248 0
487929 일반 와 미쳤다 6월6일 [5] ㅇㅇ갤로그로 이동합니다. 08:06 648 5
487928 일반 념글 다시 보니 웃기긴 하노 [1] ㅇㅇ(116.127) 08:04 210 0
487927 일반 야 그래서 여름에나오는건 맞냐?!!! ㅇㅇ(133.106) 08:02 45 0
487926 일반 6월6일 같은 소리 말고 12일이나 기다려 적절한김대기(114.202) 08:01 123 0
487925 일반 갤주는 봐라 댜댣(118.235) 07:59 41 0
487924 일반 oai 애들이 뭔가를 올리긴 했네 [1] ㅇㅇ(182.226) 07:55 404 0
487923 일반 그래서 뭐 나옴? ㅇㅇ갤로그로 이동합니다. 07:51 43 0
487922 일반 무라티 누나는 저번 발표때가 이뻣지... [1] ㅇㅇ갤로그로 이동합니다. 07:51 260 0
487921 일반 미국대선 끝나고도 안나오면 역대급 겨울 진입이냐 [2] ㅇㅇ(175.199) 07:42 144 1
487920 일반 doesn't care 호루스의시대갤로그로 이동합니다. 07:41 99 0
487918 일반 몇주(한달 다되어감 ㅋㅋㅋ) ㅇㅇ갤로그로 이동합니다. 07:30 98 0
487917 일반 오늘도 꿀잠충 연전연승 ㅇㅇ(118.33) 07:30 57 0
487916 일반 미라무라티 잘나온 사진 야갤학갤로그로 이동합니다. 07:27 225 0
487914 일반 it업계에서 조지호츠는 어느정도급임?? [12] 야갤학갤로그로 이동합니다. 07:18 233 0
487913 일반 GPT4O 3시간마다 질문 최대 몇개임? [5] ㅇㅇ(183.101) 07:12 234 0
487912 일반 환상에 살았다 [1] ㅇㅇ갤로그로 이동합니다. 07:08 233 6
487911 일반 gpt5 정배 8~9월 아니었음? [1] ㅇㅇ갤로그로 이동합니다. 07:06 152 0
487910 일반 특붕이의 현주소 [3] ㅇㅇ(223.38) 06:57 211 3
487909 일반 전세계 최고 영향력 눈나 외모 야갤학갤로그로 이동합니다. 06:57 296 0
487908 일반 솔직히 서울이 그렇게 좋음? [24] ㅇㅇ(118.235) 06:55 417 0
487907 일반 그래서 숫자세기는 어떻게 됐음? [2] ㅇㅇ(223.38) 06:49 201 0
487906 일반 4+1=5 !! ㅇㅇ(223.38) 06:46 119 0
487905 일반 이 갤러리 오늘 새벽은 ㄹㅇ 역대급으로 추했다 [2] ㅇㅇ(175.192) 06:37 446 2
487904 일반 이쯤에서 보는 레전드 트윗 [3] ㅇㅇ(138.199) 06:36 389 2
487903 일반 마지막 평범한 여름 보내라니까 [1] ㅇㅇ(58.228) 06:21 145 0
487902 일반 이젠 2045년 예측도 못 믿겠노 ㅇㅇ(218.152) 06:12 128 0
487901 일반 앰생.jpg [1] ㅇㅇ(125.133) 06:08 278 3
487898 일반 오늘도 얀르쿤 1승! ㅇㅇ(119.197) 05:40 138 1
487897 일반 기대컨한 나의 승리네 ㅇㅇ(39.124) 05:30 211 0
487896 일반 신간발매 이번달 25일이네 ㅇㅇ갤로그로 이동합니다. 05:13 92 0
487895 일반 낚였구나! [2] 초존도초갤로그로 이동합니다. 05:02 373 1
487894 일반 예아딱좋노 갤럭시빠갤로그로 이동합니다. 04:41 113 1
487893 일반 나 일본 특붕인데 [1] ㅇㅇ(133.149) 04:38 165 1
487892 정보/ 오픈소스 Qwen-2 발표 [3] ㅇㅇ(121.178) 04:14 645 6
487891 일반 도파민 금단증상 ㄹㅇ 보기 애잔하네 ㅇㅇ(223.62) 04:08 177 0
487890 일반 아직 새벽 5시가 있음 ㅇㅇ갤로그로 이동합니다. 04:05 113 0
487889 일반 보이스 출시 [3] ㅇㅇ(211.250) 04:03 324 0
487888 일반 한국어 잘하는 중국 7b 모델이나 보구가 [1] ㅇㅇ갤로그로 이동합니다. 04:02 226 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2