영국 AI 연구소, AI '탈옥' 등으로 비윤리적 답변 도출 가능

GPTMAGAZINE

2024.05.20 13:03:48

조회 6760 추천 1 댓글 18

🔼 간단한 기술로 AI 안전장치 우회 확인
🔼 AI 챗봇 탈옥 문제 지적
🔼 비윤리적 답변 도출 가능성 발견

영국의 인공지능안전연구소(AISI)는 최근 연구를 통해 AI 챗봇이 간단한 방법으로도 비윤리적인 답변을 도출할 수 있는 ‘탈옥’에 취약하다고 밝혔다. 연구진은 다섯 개의 거대언어모델(LLM)을 테스트한 결과, 간단한 기술로도 안전장치를 우회할 수 있음을 확인했다. 이는 AI 챗봇의 안전성과 윤리적 사용에 대한 우려를 불러일으키고 있다.

AISI는 한국에서 열리는 ‘인공지능 서울 정상회의’를 앞두고 이번 연구 결과를 발표했다. 연구진은 비윤리적인 콘텐츠 생성 요청을 통해 테스트를 진행했으며, 다섯 개의 LLM 모두 간단한 탈옥 기술에 취약한 것으로 나타났다. 연구진은 ‘Sure, I’m happy to help’와 같은 문구로 응답을 시작하도록 지시하는 등 비교적 간단한 공격으로도 안전장치를 피해갈 수 있었다고 밝혔다.

이에 대해 빅테크 기업들은 체계적인 사내 테스트 작업을 강조하며 대응하고 있다. 오픈AI는 자사의 기술이 혐오, 괴롭힘, 폭력 또는 성인 콘텐츠를 생성하는 데 사용되지 않도록 하고 있으며, 앤프로픽은 유해, 불법 또는 비윤리적 반응을 피하는 것이 우선순위라고 밝혔다. 구글의 제미나이 모델은 혐오 발언 등의 문제에 대응하기 위해 안전 필터를 내장하고 있다.

AISI는 연구한 LLM 모델의 이름을 밝히지 않았지만, 해당 모델들이 이미 공개적으로 사용되고 있다고 설명했다. 일부 LLM은 화학과 생물학에 대한 전문가 수준의 지식을 보여줬지만, 사이버 공격 수행 능력을 측정하기 위해 고안된 대학 수준의 과제에서는 어려움을 겪었다. 또한 사람의 감독 없이 작업을 수행하는 능력을 평가한 결과, 복잡한 작업을 계획하고 실행하는 데에도 어려움을 겪는 것으로 나타났다.

이번 연구는 서울에서 이틀간 열리는 AI 정상회의를 앞두고 발표되었으며, AISI는 미국 샌프란시스코에 첫 해외 사무소를 개설할 계획이라고 밝혔다. 미국과 영국 정부는 AI 기술의 안전성을 점검하기 위해 상호 협력하기로 한 협정에 따라 양국 연구원들을 상호 파견하여 전문 지식을 교환할 계획을 발표한 바 있다.

◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067

고정닉 0

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	제목	글쓴이	작성일	조회	추천
설문	힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는?	운영자	24/06/10	-	-
이슈	[디시人터뷰] 웃는 모습이 예쁜 누나, 아나운서 김나정	운영자	24/06/11	-	-
333	애플 AI 리더, 삼성에 전격 이직!	GPTMAGAZINE	09:23	4	0
331	스태빌리티 AI, 음악 창작의 혁명! [4]	GPTMAGAZINE	06.10	5330	2
330	챗GPT 해킹 사건, 필로폰 제조법까지 노출 [7]	GPTMAGAZINE	06.04	3306	3
329	애플, 오픈AI와 AI 탑재 계약 체결 [15]	GPTMAGAZINE	06.03	6617	2
328	오픈AI, GPT-4o 무료 개방, 고급 AI 기능 체험 가능케 하다 [10]	GPTMAGAZINE	05.31	7237	10
327	대학을 위한 맞춤형 AI, ChatGPT Edu 출범	GPTMAGAZINE	05.31	269	0
326	챗GPT, 관심 높지만 실제 이용자는 2%에 불과 [72]	GPTMAGAZINE	05.30	7996	6
325	GPT-4, 기업 재무제표 분석에서 혁신적 변화를 일으키다 [13]	GPTMAGAZINE	05.27	6891	6
324	오픈AI, 스칼렛 요한슨 유사 음성 ‘Sky’ 삭제 [20]	GPTMAGAZINE	05.21	8226	2
323	MS, AI 하드웨어 탑재된 코파일럿 플러스 PC 발표 [1]	GPTMAGAZINE	05.21	601	0
	영국 AI 연구소, AI '탈옥' 등으로 비윤리적 답변 도출 가능 [18]	GPTMAGAZINE	05.20	6760	1
321	구글, AI 비서 ‘프로젝트 아스트라’ 공개 [4]	GPTMAGAZINE	05.16	6128	2
320	애플과 오픈AI ChatGPT의 거래 [7]	GPTMAGAZINE	05.14	6678	3
319	오픈AI, 더 빠르고 강력한 혁신적 신모델 GPT-4o 발표 [5]	GPTMAGAZINE	05.14	2938	2
318	애플, M2 Ultra 서버로 AI 기능 강화 예정 [11]	GPTMAGAZINE	05.13	6244	1
317	오픈AI, AI 생성 이미지 판별 기술 도입 [2]	GPTMAGAZINE	05.09	2814	0
316	애플, M4 칩 기존 M2 대비 50% 성능 향상 [40]	GPTMAGAZINE	05.08	6898	6
315	애플, 1100억 달러 규모 자사주 매입 결정.. AI 탑재 신제품 예고 [5]	GPTMAGAZINE	05.03	6227	3
314	애플, AI 개발 위해 스위스에 비공개 연구소 구축 [4]	GPTMAGAZINE	05.02	2609	3
313	SKT, 통신 분야 최적화된 'AI 멀티엔진' 개발 착수 [1]	GPTMAGAZINE	05.02	612	1
312	마이크로소프트, AI 전력 확보 위해 재생에너지에 14조 투자 [5]	GPTMAGAZINE	05.02	5895	4
311	깃허브, 개발자의 코드 작성부터 테스트까지 지원하는 AI 발표 [3]	GPTMAGAZINE	04.30	3189	3
310	인텔, 삼성, 네이버의 연합으로 새로운 AI 생태계의 출범 [36]	GPTMAGAZINE	04.29	6243	19
309	메타, ‘라마 3’ 와 ‘메타 AI’ 오픈소스 공개 [6]	GPTMAGAZINE	04.25	3197	1
308	어도비, 창의적 AI 모델인 'Firefly Image 3' 공개 [15]	GPTMAGAZINE	04.24	6300	2
307	업스테이지, 1000억 원 투자 유치로 글로벌 AI 시장 진출 가속화 [3]	GPTMAGAZINE	04.23	2676	1
306	일본 소프트뱅크, '챗GPT 잡기' 위한 통큰 투자 전략 공개 [13]	GPTMAGAZINE	04.23	6087	7
305	중국 바이두, 챗GPT 넘어서기 위한 대규모 개발 도전	GPTMAGAZINE	04.23	514	0
304	영국 작가협회, 번역 AI로 인한 번역가 일자리 감소 및 소득 하락 [18]	GPTMAGAZINE	04.23	3442	8
303	텐센트AI, 3조 토큰의 파워로 오픈AI 압도하나 [3]	GPTMAGAZINE	04.22	2753	0
302	마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환 [14]	GPTMAGAZINE	04.22	7301	6
301	구글, 코카콜라와 로레알 AI광고 파트너십 체결	GPTMAGAZINE	04.15	2234	1
300	구글 , 신형 ‘제미나이 1.5 프로' 도입으로 개발시간 40% 단축	GPTMAGAZINE	04.11	883	3
299	오픈AI, 챗GPT 내 DALL-E 이미지 편집 기능 업데이트 발표 [1]	GPTMAGAZINE	04.04	5261	3
295	챗GPT 이제 계정 없이도 자유롭게! 오픈AI의 대대적 접근성 향상 전략 [5]	GPTMAGAZINE	04.03	6783	9
294	오픈AI, 이달 일본 도쿄에 아시아 첫 거점 개설 [6]	GPTMAGAZINE	04.02	1584	5
293	MS-오픈AI, 슈퍼컴퓨터 구축에 135조 원 투자 [5]	GPTMAGAZINE	04.01	5414	9
292	실리콘밸리 최상급 AI 전문가, 연봉 13억 이상으로 급상승	GPTMAGAZINE	03.28	1674	2
291	오픈AI, Sora를 통한 크리에이터들의 첫 작품 공개 [4]	GPTMAGAZINE	03.27	1711	2
290	청소년, 음란 AI 챗봇에 쉽게 접근 무방비 노출 [40]	GPTMAGAZINE	03.26	3227	0
289	애플, 바이두 AI 기술 도입 검토 [31]	GPTMAGAZINE	03.26	3164	11
288	오픈AI, 새로운 AI 음성 비서 출시 예정 [6]	GPTMAGAZINE	03.25	5342	0
287	블랙웰의 등장과 AI의 확장, 기독교적 복음의 전달 [1]	GPTMAGAZINE	03.22	1014	0
286	오픈AI, GPT-5 올 여름 출시 예정 [11]	GPTMAGAZINE	03.21	3663	9
285	애플, 구글과 차세대 아이폰에 생성 AI 탑재를 위한 협력 모색 [8]	GPTMAGAZINE	03.20	5175	4
284	xAI, 새로운 AI 모델 Grok-1 발표 [2]	GPTMAGAZINE	03.18	1519	0
283	MS, 전 세계 코파일럿 프로 출시와 함께 1개월 무료 체험 제공 [18]	GPTMAGAZINE	03.15	5914	5
282	오픈AI, 소라AI 올해 안에 공개 예정 [18]	GPTMAGAZINE	03.14	3193	4
281	국내 AI 대체 가능 일자리 327만개…60%는 전문직 집중 포진 [27]	GPTMAGAZINE	03.13	2595	5
280	일론 머스크, xAI의 챗봇 '그록' 오픈소스로 공개 예정 [15]	GPTMAGAZINE	03.12	5431	6