영국 AI 연구소, AI '탈옥' 등으로 비윤리적 답변 도출 가능

GPTMAGAZINE

2024.05.20 13:03:48

조회 7337 추천 1 댓글 18

🔼 간단한 기술로 AI 안전장치 우회 확인
🔼 AI 챗봇 탈옥 문제 지적
🔼 비윤리적 답변 도출 가능성 발견

영국의 인공지능안전연구소(AISI)는 최근 연구를 통해 AI 챗봇이 간단한 방법으로도 비윤리적인 답변을 도출할 수 있는 ‘탈옥’에 취약하다고 밝혔다. 연구진은 다섯 개의 거대언어모델(LLM)을 테스트한 결과, 간단한 기술로도 안전장치를 우회할 수 있음을 확인했다. 이는 AI 챗봇의 안전성과 윤리적 사용에 대한 우려를 불러일으키고 있다.

AISI는 한국에서 열리는 ‘인공지능 서울 정상회의’를 앞두고 이번 연구 결과를 발표했다. 연구진은 비윤리적인 콘텐츠 생성 요청을 통해 테스트를 진행했으며, 다섯 개의 LLM 모두 간단한 탈옥 기술에 취약한 것으로 나타났다. 연구진은 ‘Sure, I’m happy to help’와 같은 문구로 응답을 시작하도록 지시하는 등 비교적 간단한 공격으로도 안전장치를 피해갈 수 있었다고 밝혔다.

이에 대해 빅테크 기업들은 체계적인 사내 테스트 작업을 강조하며 대응하고 있다. 오픈AI는 자사의 기술이 혐오, 괴롭힘, 폭력 또는 성인 콘텐츠를 생성하는 데 사용되지 않도록 하고 있으며, 앤프로픽은 유해, 불법 또는 비윤리적 반응을 피하는 것이 우선순위라고 밝혔다. 구글의 제미나이 모델은 혐오 발언 등의 문제에 대응하기 위해 안전 필터를 내장하고 있다.

AISI는 연구한 LLM 모델의 이름을 밝히지 않았지만, 해당 모델들이 이미 공개적으로 사용되고 있다고 설명했다. 일부 LLM은 화학과 생물학에 대한 전문가 수준의 지식을 보여줬지만, 사이버 공격 수행 능력을 측정하기 위해 고안된 대학 수준의 과제에서는 어려움을 겪었다. 또한 사람의 감독 없이 작업을 수행하는 능력을 평가한 결과, 복잡한 작업을 계획하고 실행하는 데에도 어려움을 겪는 것으로 나타났다.

이번 연구는 서울에서 이틀간 열리는 AI 정상회의를 앞두고 발표되었으며, AISI는 미국 샌프란시스코에 첫 해외 사무소를 개설할 계획이라고 밝혔다. 미국과 영국 정부는 AI 기술의 안전성을 점검하기 위해 상호 협력하기로 한 협정에 따라 양국 연구원들을 상호 파견하여 전문 지식을 교환할 계획을 발표한 바 있다.

◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067

고정닉 0

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	제목	글쓴이	작성일	조회	추천
설문	사이버 렉카로 가장 피해 입은 것 같은 스타는?	운영자	24/07/22	-	-
351	Meta, 최신 AI 모델 'Rama 3.1' 출시 [8]	GPTMAGAZINE	07.25	1195	1
350	애플, 2.5조 개 토큰으로 훈련된 7B 오픈소스 언어 모델 공개	GPTMAGAZINE	07.23	2357	2
349	네이버 거대AI 하이퍼클로바, 파라미터 숫자 공개 [10]	GPTMAGAZINE	07.22	2348	1
348	오픈AI, 자사 최강 모델의 미니 버전 'GPT-4o mini' 출시 [13]	GPTMAGAZINE	07.19	1404	1
347	엔비디아-미스트랄AI, 신규 AI 모델 '미스트랄 네모' 출시	GPTMAGAZINE	07.19	120	1
346	글로벌 건설 AI 시장, 2조원 돌파 [3]	GPTMAGAZINE	07.18	1080	1
345	엔비디아와 메타 CEO, SIGGRAPH에서 AI와 그래픽스의 미래 논의 [1]	GPTMAGAZINE	07.17	1006	1
344	AI, 알츠하이머 예측 정확도 78.5% 달성 [10]	GPTMAGAZINE	07.16	2612	6
343	(주) 엑스알엑스, 마이크로소프트 런처 프로그램 선정	GPTMAGAZINE	07.15	287	0
342	오픈AI, AGI 5단계 중 2단계 발표	GPTMAGAZINE	07.15	402	0
341	오픈AI 서비스 중단! 중국 기업 '멘붕' [46]	GPTMAGAZINE	07.10	7845	17
340	AI 기술, 군사 분야서 활약 중…보안 문제 해결 시급 [3]	GPTMAGAZINE	07.08	2169	2
339	애플, 오픈AI 이사회 참관 "MS와 동등한 위치 확보" [5]	GPTMAGAZINE	07.05	2354	0
338	(주)엑스알엑스, 2024년 인천공항 스타트업 육성사업 선정	GPTMAGAZINE	07.02	4964	0
337	챗GPT, 인간을 능가한 재무제표 분석 능력 [4]	GPTMAGAZINE	07.01	6895	8
336	챗GPT-4, 실제 학생보다 높은 점수 받아 [34]	GPTMAGAZINE	06.27	7452	13
335	오픈AI 창업자 일리야 수츠케버, 새로운 AI 스타트업 설립 [2]	GPTMAGAZINE	06.24	3010	1
334	AI 미인대회, 1500명 참가 [32]	GPTMAGAZINE	06.17	12598	22
333	애플 AI 리더, 삼성에 전격 이직! [21]	GPTMAGAZINE	06.13	3517	5
331	스태빌리티 AI, 음악 창작의 혁명! [5]	GPTMAGAZINE	06.10	6214	2
330	챗GPT 해킹 사건, 필로폰 제조법까지 노출 [7]	GPTMAGAZINE	06.04	4303	3
329	애플, 오픈AI와 AI 탑재 계약 체결 [16]	GPTMAGAZINE	06.03	7317	2
328	오픈AI, GPT-4o 무료 개방, 고급 AI 기능 체험 가능케 하다 [10]	GPTMAGAZINE	05.31	8116	10
327	대학을 위한 맞춤형 AI, ChatGPT Edu 출범	GPTMAGAZINE	05.31	612	0
326	챗GPT, 관심 높지만 실제 이용자는 2%에 불과 [78]	GPTMAGAZINE	05.30	8834	6
325	GPT-4, 기업 재무제표 분석에서 혁신적 변화를 일으키다 [13]	GPTMAGAZINE	05.27	7491	6
324	오픈AI, 스칼렛 요한슨 유사 음성 ‘Sky’ 삭제 [20]	GPTMAGAZINE	05.21	8856	2
323	MS, AI 하드웨어 탑재된 코파일럿 플러스 PC 발표 [1]	GPTMAGAZINE	05.21	1134	1
	영국 AI 연구소, AI '탈옥' 등으로 비윤리적 답변 도출 가능 [18]	GPTMAGAZINE	05.20	7337	1
321	구글, AI 비서 ‘프로젝트 아스트라’ 공개 [4]	GPTMAGAZINE	05.16	6640	2
320	애플과 오픈AI ChatGPT의 거래 [8]	GPTMAGAZINE	05.14	7223	3
319	오픈AI, 더 빠르고 강력한 혁신적 신모델 GPT-4o 발표 [5]	GPTMAGAZINE	05.14	3412	2
318	애플, M2 Ultra 서버로 AI 기능 강화 예정 [12]	GPTMAGAZINE	05.13	6712	1
317	오픈AI, AI 생성 이미지 판별 기술 도입 [2]	GPTMAGAZINE	05.09	3271	0
316	애플, M4 칩 기존 M2 대비 50% 성능 향상 [41]	GPTMAGAZINE	05.08	7373	6
315	애플, 1100억 달러 규모 자사주 매입 결정.. AI 탑재 신제품 예고 [5]	GPTMAGAZINE	05.03	6674	3
314	애플, AI 개발 위해 스위스에 비공개 연구소 구축 [4]	GPTMAGAZINE	05.02	3062	3
313	SKT, 통신 분야 최적화된 'AI 멀티엔진' 개발 착수 [1]	GPTMAGAZINE	05.02	1032	1
312	마이크로소프트, AI 전력 확보 위해 재생에너지에 14조 투자 [5]	GPTMAGAZINE	05.02	6328	4
311	깃허브, 개발자의 코드 작성부터 테스트까지 지원하는 AI 발표 [3]	GPTMAGAZINE	04.30	3651	3
310	인텔, 삼성, 네이버의 연합으로 새로운 AI 생태계의 출범 [36]	GPTMAGAZINE	04.29	6698	19
309	메타, ‘라마 3’ 와 ‘메타 AI’ 오픈소스 공개 [6]	GPTMAGAZINE	04.25	3622	1
308	어도비, 창의적 AI 모델인 'Firefly Image 3' 공개 [15]	GPTMAGAZINE	04.24	6742	2
307	업스테이지, 1000억 원 투자 유치로 글로벌 AI 시장 진출 가속화 [3]	GPTMAGAZINE	04.23	3111	1
306	일본 소프트뱅크, '챗GPT 잡기' 위한 통큰 투자 전략 공개 [13]	GPTMAGAZINE	04.23	6507	7
305	중국 바이두, 챗GPT 넘어서기 위한 대규모 개발 도전	GPTMAGAZINE	04.23	727	0
304	영국 작가협회, 번역 AI로 인한 번역가 일자리 감소 및 소득 하락 [18]	GPTMAGAZINE	04.23	3880	8
303	텐센트AI, 3조 토큰의 파워로 오픈AI 압도하나 [3]	GPTMAGAZINE	04.22	3188	0
302	마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환 [14]	GPTMAGAZINE	04.22	7799	7
301	구글, 코카콜라와 로레알 AI광고 파트너십 체결	GPTMAGAZINE	04.15	2448	1