아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] 아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

ㅇㅇ(182.230) 2024.05.17 20:10:58

조회 282 추천 1 댓글 3

https://www.aitimes.com/news/articleView.html?idxno=159751

아마존

텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔다. 오픈AI와 구글이 각각 음성 인공지능(AI) 비서 'GPT-4o'와 '아스트라'를 공개한 지 고작 며칠 만이다.벤처비트는 16일(현지시간) 아마존 웹 서비스(AWS) 연구진이 음성을 이헤ㅐ하고 응답할 수 있는 LLM에 대한 심각한 보안 결점을 지적하는 논문을 발표했다고 보도했다.연구진은 스마트 스피커부터 AI 비서까지 음성 엔터페이스가 보편화됨에 따라 안전성을 보장하는 것이 중요해지고 있지만, LLM에 내장된

www.aitimes.com

7ce88971b08307f739ed87e044ee7069405daaf0281a08a2b4a5f4a57de8a3a12f42

텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔다. 오픈AI와 구글이 각각 음성 인공지능(AI) 비서 'GPT-4o'와 '아스트라'를 공개한 지 고작 며칠 만이다.

벤처비트는 16일(현지시간) 아마존 웹 서비스(AWS) 연구진이 음성을 이헤ㅐ하고 응답할 수 있는 LLM에 대한 심각한 보안 결점을 지적하는 논문을 발표했다고 보도했다.

연구진은 스마트 스피커부터 AI 비서까지 음성 엔터페이스가 보편화됨에 따라 안전성을 보장하는 것이 중요해지고 있지만, LLM에 내장된 가드레일에도 불구하고 음성언어모델(Speech Language Model)이 적대적 공격에 매우 취약하다는 사실을 발견했다고 지적했다.

즉, 오디오 입력 시 약간의 교란을 통해 모델의 탈옥을 쉽게 유도할 수 있다는 설명이다.

연구진은 '투영 경사하강법(Projected Gradient Descent)'이라는 기술을 사용, 모델이 노골적인 폭력부터 증오심 표현까지 12가지 범주에 걸쳐 유해한 결과를 생성하는 데 성공했다고 전했다. 특히 성공률은 90%에 달했다고 강조했다.

7ce88971b08307f739ed87e045ee7068c268370ef4c6bb1f43aaf939b8b56fdd62

또 교차 모델 및 교차 프롬프트 공격과 같은 기술을 사용하는 '전송 공격(Transfer attacks)' 방법을 통해서는 10%의 평균 성공률을 기록했다고 밝혔다. 이는 한 모델에서 만들어진 오디오 공격이 직접적인 액세스 없이도 다른 모델로 전송되는 경우를 말한다.

수석 저자인 라그후비어 페리는 “다양한 모델 아키텍처에 걸쳐 이런 공격이 전달될 수 있다는 점은 현재 이런 시스템을 정렬하고 훈련하는 방법에 문제가 있음을 시사한다"라고 말했다.

7ce88971b08307f739ed87e042ee70681e215535e0a640c20ce483a504646a1139

AWS 연구진은 오디오 입력에 무작위 노이즈를 추가하는 '무작위 평활화(Randomized Smoothing)'라고 알려진 기술 등을 대책으로 제안했다. 실험에서는 이를 통해 공격 성공률이 크게 감소했다. 그러나 연구진은 완전한 해결책은 아니라고 경고했다.

페리 연구원은 "적의 공격에 방어하는 것은 일종의 군비 경쟁"이라며 “모델의 기능이 향상되며, 오용 가능성도 커졌다. 지속적인 안전 투자가 중요하다”라고 밝혔다.

실제로 연구에 활용된 음성 모델은 첨단 성능을 달성하기 위해 대화 데이터 학습을 거쳤으며, 실험 전 안전 및 유용성 벤치마크에서 모두 80% 이상을 달성했다.

이번 연구는 음성 AI 비서 도입 본격화를 앞두고 보안에 대한 문제를 미리 검토해야 한다는 경고로 등장했다.

연구의 공동 저자인 카트린 키르초프는 “우리는 음성 AI 기술의 변곡점에 와 있다"라며 "이는 사회에 이익을 줄 수 있는 엄청난 잠재력을 가지고 있지만, 책임감 있게 개발하지 않으면 해를 끼칠 수도 있다”라고 말했다.

고정닉 1

원본 첨부파일 3본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2864	설문	비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는?	운영자	24/06/03	-	-
242613	공지	특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3136]	*특갤용*	23.08.06	39964	43
433260	공지	웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [2]	*부패하는유전자!!!*	24.03.06	2725	2
363220	공지	선형글 삭제 기준 [7]	*특갤용*	23.10.14	7447	24
375493	공지	필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40]	ㅇㅇ(182.230)	23.11.11	13633	122
373402	공지	직업 비하, 조롱 글 30일 차단됩니다. [51]	*특갤용*	23.11.07	9100	79
385147	공지	구글의 AGI 분류 체계 [17]	ㅇㅇ	23.11.22	8627	31
332612	공지	음모론 삭제 기준을 안내드립니다. [23]	*특갤용*	23.08.25	9333	30
412470	공지	레이 커즈와일 신간 6월 25일 발매 [29]	모브	24.01.24	8239	34
259237	공지	특갤 용어 모음집 [6]	*특갤용*	23.08.09	22999	33
488210	역노화	서른 즈음되면 삶의 길이 보임	ㅇㅇ(121.169)	20:02	10	0
488209	일반	asi만들면 알트만도 이 ㅈㄹ하는거임??	ㅇㅇ(114.129)	20:00	20	0
488208	일반	Gpt4o 모바일 베타 업데이트 되었다 [1]	ㅇㅇ(223.38)	19:56	44	0
488207	일반	나는 agi가 달성되어도 초지능까지는 시간이 오래 걸릴거라고 생각함 [3]	ㅇㅇ(218.156)	19:47	73	0
488206	일반	지금 gpt 4o 속도 어떠냐 나만 존나느림? [1]	ㅇㅇ(112.170)	19:45	33	0
488205	일반	진지하게 구글이 뭘 잘못했냐? [5]	ㅇㅇ	19:41	113	3
488204	일반	작년에 티비 광고 퀄이 진짜 떨어졌다고 느꼈는데 올해는 좀 진일보함	ㅇㅇ(112.161)	19:41	32	0
488203	일반	gpt-4o가 말하는 엔비디아, CUDA, 그리고 독점법 [8]	천사다천사	19:37	110	0
488202	일반	머신러닝에서 오버피팅 이야기는 이제 안나오냐? [27]	ㅇㅇ(112.161)	19:36	128	0
488201	일반	갤 럭 시 = 찐 따 폰 임 [3]	ㅇㅇ(182.214)	19:34	87	0
488200	일반	어 단어 발견함 [4]	ㅇㅇ	19:31	91	0
488199	일반	자지 보지	ㅇㅇ(211.197)	19:30	33	0
488198	일반	엔비디아가 반독점 기소 당할만 했지 [3]	ㅇㅇ(119.207)	19:28	109	0
488197	일반	AGI 2029가 맞다면 [4]	천사다천사	19:26	71	0
488196	일반	‘절대영도’ 가까이… 양자실험 새 국면 연다	ㅇㅇ	19:24	97	0
488195	일반	인류 최대 빙하기 갤 [1]	ㅇㅇ(218.149)	19:21	60	0
488194	일반	일리야의 행선지가 어딜까? [5]	ㅇㅇ(211.109)	19:21	82	0
488193	일반	뤼튼이 어떻게 투자 받았나? 곰곰히 생각해봤음 [2]	ㅇㅇ(112.163)	19:19	104	0
488192	일반	이거 위험함 [4]	ㅇㅇ(112.165)	19:19	111	1
488191	일반	gpt4 좀만 꼬우면 오류뜸	갤럭시빠	19:19	27	0
488190	일반	앞으로 비틱질 하면서 피자 안쏘면 차단먹이센 [8]	Dall리신(121.157)	19:19	65	0
488189	일반	구글이 개발휴가를 가지 않은 세계선이 궁금하다	ㅇㅇ	19:18	38	0
488188	일반	레오폴드 예측그래프 [2]	ㅇㅇ(121.190)	19:18	101	0
488187	일반	어차피 좆트만 좆스크 좆르쿤 좆스비스필요없음 [1]	ㅇㅇ	19:17	53	0
488186	일반	장기기억 문제가 해결된 ai가 궁금하다 [2]	천사다천사	19:16	35	0
488184	일반	특붕이들 단체 우울증 걸렸노 [2]	ㅇㅇ(223.39)	19:14	75	0
488183	일반	제타 플롭스 달성하면 agi가능함? [1]	ㅇㅇ	19:11	41	0
488182	일반	ㅌㅇㅈ ㅈㅂ 231ㅇㅊ	포스트휴먼.	19:10	23	1
488181	일반	얀르쿤이 맞긴한데 agi달성하긴할거임 [3]	ㅇㅇ	19:10	83	0
488179	일반	2000년생들은 65살까지 일하다가 70~80쯤에 죽을거같냐 [4]	ㅇㅇ(59.7)	19:06	111	0
488178	일반	나는 구글이 21세기를 지배할거라고 생각했음 [7]	천사다천사	19:02	128	0
488177	일반	Few weeks 란 며칠인가 [3]	ㅇㅇ(223.38)	19:02	88	0
488176	일반	OAI는 LLM으로도 충분히 AGI가능! 입장인 거? [4]	ㅇㅇ(121.128)	19:00	95	0
488175	일반	제미나이 1.5 pro 언제까지 무료임?? [3]	ㅇㅇ(112.153)	18:58	81	0
488174	일반	특갤 원래 초xxx 갤 아니엇음ㄴ? [10]	국밥충	18:53	171	0
488173	일반	몇주전에 하사비스가 내년에 큰거 온다고 했음 [3]	ㅇㅇ	18:53	140	1
488172	일반	구글 내부적으로 agi연구하고있을듯 [1]	ㅇㅇ(218.158)	18:48	97	2
488171	일반	4o 보이스랑 비전 포함? 10만원은 충분히 내지 [5]	ㅇㅇ(220.72)	18:42	125	0
488170	일반	동해 유전 관련해서 GPT 한테 물어보았다. [2]	ㅇㅇ(115.143)	18:42	152	0
488169	일반	미소녀 안드로이드랑 놀고 싶음 [1]	ㅇㅇ	18:38	54	0
488168	일반	gpt한테 물어보니 최대 5주라는데.	oo(110.11)	18:37	69	0