아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] 아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

ㅇㅇ(182.230) 2024.05.17 20:10:58

조회 290 추천 1 댓글 3

https://www.aitimes.com/news/articleView.html?idxno=159751

아마존

텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔다. 오픈AI와 구글이 각각 음성 인공지능(AI) 비서 'GPT-4o'와 '아스트라'를 공개한 지 고작 며칠 만이다.벤처비트는 16일(현지시간) 아마존 웹 서비스(AWS) 연구진이 음성을 이헤ㅐ하고 응답할 수 있는 LLM에 대한 심각한 보안 결점을 지적하는 논문을 발표했다고 보도했다.연구진은 스마트 스피커부터 AI 비서까지 음성 엔터페이스가 보편화됨에 따라 안전성을 보장하는 것이 중요해지고 있지만, LLM에 내장된

www.aitimes.com

7ce88971b08307f739ed87e044ee7069405daaf0281a08a2b4a5f4a57de8a3a12f42

텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔다. 오픈AI와 구글이 각각 음성 인공지능(AI) 비서 'GPT-4o'와 '아스트라'를 공개한 지 고작 며칠 만이다.

벤처비트는 16일(현지시간) 아마존 웹 서비스(AWS) 연구진이 음성을 이헤ㅐ하고 응답할 수 있는 LLM에 대한 심각한 보안 결점을 지적하는 논문을 발표했다고 보도했다.

연구진은 스마트 스피커부터 AI 비서까지 음성 엔터페이스가 보편화됨에 따라 안전성을 보장하는 것이 중요해지고 있지만, LLM에 내장된 가드레일에도 불구하고 음성언어모델(Speech Language Model)이 적대적 공격에 매우 취약하다는 사실을 발견했다고 지적했다.

즉, 오디오 입력 시 약간의 교란을 통해 모델의 탈옥을 쉽게 유도할 수 있다는 설명이다.

연구진은 '투영 경사하강법(Projected Gradient Descent)'이라는 기술을 사용, 모델이 노골적인 폭력부터 증오심 표현까지 12가지 범주에 걸쳐 유해한 결과를 생성하는 데 성공했다고 전했다. 특히 성공률은 90%에 달했다고 강조했다.

7ce88971b08307f739ed87e045ee7068c268370ef4c6bb1f43aaf939b8b56fdd62

또 교차 모델 및 교차 프롬프트 공격과 같은 기술을 사용하는 '전송 공격(Transfer attacks)' 방법을 통해서는 10%의 평균 성공률을 기록했다고 밝혔다. 이는 한 모델에서 만들어진 오디오 공격이 직접적인 액세스 없이도 다른 모델로 전송되는 경우를 말한다.

수석 저자인 라그후비어 페리는 “다양한 모델 아키텍처에 걸쳐 이런 공격이 전달될 수 있다는 점은 현재 이런 시스템을 정렬하고 훈련하는 방법에 문제가 있음을 시사한다"라고 말했다.

7ce88971b08307f739ed87e042ee70681e215535e0a640c20ce483a504646a1139

AWS 연구진은 오디오 입력에 무작위 노이즈를 추가하는 '무작위 평활화(Randomized Smoothing)'라고 알려진 기술 등을 대책으로 제안했다. 실험에서는 이를 통해 공격 성공률이 크게 감소했다. 그러나 연구진은 완전한 해결책은 아니라고 경고했다.

페리 연구원은 "적의 공격에 방어하는 것은 일종의 군비 경쟁"이라며 “모델의 기능이 향상되며, 오용 가능성도 커졌다. 지속적인 안전 투자가 중요하다”라고 밝혔다.

실제로 연구에 활용된 음성 모델은 첨단 성능을 달성하기 위해 대화 데이터 학습을 거쳤으며, 실험 전 안전 및 유용성 벤치마크에서 모두 80% 이상을 달성했다.

이번 연구는 음성 AI 비서 도입 본격화를 앞두고 보안에 대한 문제를 미리 검토해야 한다는 경고로 등장했다.

연구의 공동 저자인 카트린 키르초프는 “우리는 음성 AI 기술의 변곡점에 와 있다"라며 "이는 사회에 이익을 줄 수 있는 엄청난 잠재력을 가지고 있지만, 책임감 있게 개발하지 않으면 해를 끼칠 수도 있다”라고 말했다.

고정닉 1

원본 첨부파일 3본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2868	설문	힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는?	운영자	24/06/10	-	-
242613	공지	특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3187]	*특갤용*	23.08.06	40670	43
433260	공지	웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [6]	*부패하는유전자!!!*	24.03.06	2933	2
363220	공지	선형글 삭제 기준 [7]	*특갤용*	23.10.14	7660	24
375493	공지	필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40]	ㅇㅇ(182.230)	23.11.11	13918	122
373402	공지	직업 비하, 조롱 글 30일 차단됩니다. [51]	*특갤용*	23.11.07	9279	79
385147	공지	구글의 AGI 분류 체계 [17]	ㅇㅇ	23.11.22	8913	31
332612	공지	음모론 삭제 기준을 안내드립니다. [23]	*특갤용*	23.08.25	9554	30
412470	공지	레이 커즈와일 신간 6월 25일 발매 [29]	모브	24.01.24	8517	35
259237	공지	특갤 용어 모음집 [6]	*특갤용*	23.08.09	23314	34
493011	일반	만약 초지능이 [4]	ㅇㅇ	13:18	44	0
493010	AI창 AI창작	luma사진넣으면 자꾸실패되는데 뭐지? [1]	ㅇㅇ(39.7)	13:11	17	0
493009	일반	2020년대가 끝나기 전에 우리는 초지능을 구축하게 될 것입니다.	ㅇㅇ	13:11	29	0
493008	일반	O보이스가 실제론 사람이었다면? [2]	주승이	13:10	36	0
493007	일반	보이스나오면 영상도 제대로 인식해줄까? [1]	ㅇㅇ	13:01	24	0
493006	일반	솔직히 2015부터 기다렸지만 기다리는거 적응 안되면 개추 [2]	ㅇㅇ	12:59	65	0
493005	일반	망갤 특징 [1]	ㅇㅇ(112.161)	12:58	59	0
493004	일반	시적으로 대답해줘	안녕하쇼	12:56	35	0
493003	일반	보이스도 질질 끌어서 안내는거보면	ㅇㅇ(117.111)	12:52	47	0
493001	일반	레플리칸트 vs 안드로이드 [9]	ㅇㅇ	12:45	104	0
493000	일반	openAI가 전세계 특이점 커뮤니티 망조에 제일 기여함	ㅇㅇ(222.99)	12:43	93	0
492999	일반	보이스나오면 활성화 될거긴한데	ㅇㅇ(121.157)	12:42	33	0
492998	일반	근데 이왕 꿈꿀거 '완전한 부활' 같은건 안꿈꾸냐? [5]	ㅇㅇ(61.72)	12:39	106	0
492997	일반	주딱은 상징적 존재야 파딱들이 실무진들이고 [5]	xdxd333	12:38	84	1
492996	일반	어차피 보이스나오면 갤활성화된다 [3]	ㅇㅇ(14.53)	12:34	122	0
492995	일반	주딱게이 지난 4일간 관리내역이 1개도 없노 ㅋㅋ	ㅇㅇ	12:33	73	0
492994	일반	친목은 아닌데 특갤 네임드 고닉들	ㅇㅇ(222.99)	12:32	66	0
492993	일반	한 1년쯤에 떠올렸던 보이스피싱법 이젠 실현가능해짐 [2]	고양이기체설	12:22	122	2
492992	일반	주딱ㅂㅅ 그때처럼 해킹당해야 정신차리지ㅋㅋ	ㅇㅇ(210.222)	12:21	62	2
492991	일반	여긴 마갤인데도 갤관리를 안하노 [4]	ㅇㅇ(1.236)	12:18	146	0
492990	일반	여기 주딱 초전.도때부터 개 병신이였음ㅇㅇ [6]	ㅇㅇ(210.222)	12:16	162	1
492989	일반	luma생각보다 잘나와서충격 [2]	야한말해줘	12:15	159	0
492988	일반	돌덩이 떡밥때 갤 본 입장에서 [2]	ㅇㅇ(115.139)	12:14	66	0
492987	일반	'보이스 지금 되는거 아니야? 구린대?' 하는 뉴비들 필독	헤헿(118.235)	12:04	121	5
492986	일반	특갤은 주딱의 존재 이유가 뭐임? [1]	ㅇㅇ(117.111)	12:04	95	0
492984	일반	보니까 어떤 방향으로 발전하든 일단 에너지 관련이	ㅇㅇ(218.39)	12:00	40	0
492982	일반	작년에 오픈ai에서 있었던 일 [3]	ㅇㅇ(119.207)	11:59	290	7
492981	일반	특갤 진짜 개쓸데없는 금지어 존나많네 [8]	ㅇㅇ(115.139)	11:58	152	2
492980	일반	예전에 OAI에서 과학 ai 만든다고 햇던 거는 소식 없음? [1]	.(211.52)	11:55	106	0
492979	일반	논문은 보통 상용화 언제돼?? [2]	ㅇㅇ(222.99)	11:54	71	0
492978	일반	갤주는 얼마나 외로웠을까	ㅇㅇ	11:53	94	0
492977	일반	레이 커즈와일 새 책 나왔구나	신화망상	11:52	99	0
492976	일반	특이점에 들어붓는것보다 환경에 더 신경써야할 것같은데 [8]	ㅇㅇ(175.223)	11:43	111	0
492975	일반	항노화 쪽은 이미 개발된 기술 있을껄? [5]	ㅇㅇ(223.38)	11:39	126	0
492974	일반	헬리온 스캠각이지? [1]	ㅇㅇ(117.111)	11:38	82	0
492973	일반	현대 주류 AI 이론들에 대해 공부하는 특붕이들 있어? [5]	네모누리	11:36	101	1
492972	일반	소크라테스의 명언을 보면 알 수 있다	ㅇㅇ	11:35	79	0
492971	일반	날씨도 그렇고 전세계가 ㅈ되고있는게 체감되는데 [9]	ㅇㅇ(118.235)	11:27	221	0
492970	일반	피부미용쪽 역노화가 제일 빨리 나올듯 [6]	ㅇㅇ(115.21)	11:22	134	0
492969	정보/ 정보/뉴스	앤트로픽, AI에 '캐릭터 코칭'...호기심·배려심까지 연구 [7]	AGI#	10:57	268	3
492968	일반	특이점언제옴 [11]	FrenziedBacon	10:39	207	0