디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

영국 AI 연구소, AI '탈옥' 등으로 비윤리적 답변 도출 가능

GPTMAGAZINE갤로그로 이동합니다. 2024.05.20 13:03:48
조회 6760 추천 1 댓글 18




🔼 간단한 기술로 AI 안전장치 우회 확인
🔼 AI 챗봇 탈옥 문제 지적
🔼 비윤리적 답변 도출 가능성 발견






영국의 인공지능안전연구소(AISI)는 최근 연구를 통해 AI 챗봇이 간단한 방법으로도 비윤리적인 답변을 도출할 수 있는 ‘탈옥’에 취약하다고 밝혔다. 연구진은 다섯 개의 거대언어모델(LLM)을 테스트한 결과, 간단한 기술로도 안전장치를 우회할 수 있음을 확인했다. 이는 AI 챗봇의 안전성과 윤리적 사용에 대한 우려를 불러일으키고 있다.


AISI는 한국에서 열리는 ‘인공지능 서울 정상회의’를 앞두고 이번 연구 결과를 발표했다. 연구진은 비윤리적인 콘텐츠 생성 요청을 통해 테스트를 진행했으며, 다섯 개의 LLM 모두 간단한 탈옥 기술에 취약한 것으로 나타났다. 연구진은 ‘Sure, I’m happy to help’와 같은 문구로 응답을 시작하도록 지시하는 등 비교적 간단한 공격으로도 안전장치를 피해갈 수 있었다고 밝혔다.


이에 대해 빅테크 기업들은 체계적인 사내 테스트 작업을 강조하며 대응하고 있다. 오픈AI는 자사의 기술이 혐오, 괴롭힘, 폭력 또는 성인 콘텐츠를 생성하는 데 사용되지 않도록 하고 있으며, 앤프로픽은 유해, 불법 또는 비윤리적 반응을 피하는 것이 우선순위라고 밝혔다. 구글의 제미나이 모델은 혐오 발언 등의 문제에 대응하기 위해 안전 필터를 내장하고 있다.


AISI는 연구한 LLM 모델의 이름을 밝히지 않았지만, 해당 모델들이 이미 공개적으로 사용되고 있다고 설명했다. 일부 LLM은 화학과 생물학에 대한 전문가 수준의 지식을 보여줬지만, 사이버 공격 수행 능력을 측정하기 위해 고안된 대학 수준의 과제에서는 어려움을 겪었다. 또한 사람의 감독 없이 작업을 수행하는 능력을 평가한 결과, 복잡한 작업을 계획하고 실행하는 데에도 어려움을 겪는 것으로 나타났다.


이번 연구는 서울에서 이틀간 열리는 AI 정상회의를 앞두고 발표되었으며, AISI는 미국 샌프란시스코에 첫 해외 사무소를 개설할 계획이라고 밝혔다. 미국과 영국 정부는 AI 기술의 안전성을 점검하기 위해 상호 협력하기로 한 협정에 따라 양국 연구원들을 상호 파견하여 전문 지식을 교환할 계획을 발표한 바 있다.









◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067

추천 비추천

1

고정닉 0

14

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
이슈 [디시人터뷰] 웃는 모습이 예쁜 누나, 아나운서 김나정 운영자 24/06/11 - -
333 애플 AI 리더, 삼성에 전격 이직! GPTMAGAZINE갤로그로 이동합니다. 09:23 4 0
331 스태빌리티 AI, 음악 창작의 혁명! [4] GPTMAGAZINE갤로그로 이동합니다. 06.10 5330 2
330 챗GPT 해킹 사건, 필로폰 제조법까지 노출 [7] GPTMAGAZINE갤로그로 이동합니다. 06.04 3306 3
329 애플, 오픈AI와 AI 탑재 계약 체결 [15] GPTMAGAZINE갤로그로 이동합니다. 06.03 6617 2
328 오픈AI, GPT-4o 무료 개방, 고급 AI 기능 체험 가능케 하다 [10] GPTMAGAZINE갤로그로 이동합니다. 05.31 7237 10
327 대학을 위한 맞춤형 AI, ChatGPT Edu 출범 GPTMAGAZINE갤로그로 이동합니다. 05.31 269 0
326 챗GPT, 관심 높지만 실제 이용자는 2%에 불과 [72] GPTMAGAZINE갤로그로 이동합니다. 05.30 7996 6
325 GPT-4, 기업 재무제표 분석에서 혁신적 변화를 일으키다 [13] GPTMAGAZINE갤로그로 이동합니다. 05.27 6891 6
324 오픈AI, 스칼렛 요한슨 유사 음성 ‘Sky’ 삭제 [20] GPTMAGAZINE갤로그로 이동합니다. 05.21 8226 2
323 MS, AI 하드웨어 탑재된 코파일럿 플러스 PC 발표 [1] GPTMAGAZINE갤로그로 이동합니다. 05.21 601 0
영국 AI 연구소, AI '탈옥' 등으로 비윤리적 답변 도출 가능 [18] GPTMAGAZINE갤로그로 이동합니다. 05.20 6760 1
321 구글, AI 비서 ‘프로젝트 아스트라’ 공개 [4] GPTMAGAZINE갤로그로 이동합니다. 05.16 6128 2
320 애플과 오픈AI ChatGPT의 거래 [7] GPTMAGAZINE갤로그로 이동합니다. 05.14 6678 3
319 오픈AI, 더 빠르고 강력한 혁신적 신모델 GPT-4o 발표 [5] GPTMAGAZINE갤로그로 이동합니다. 05.14 2938 2
318 애플, M2 Ultra 서버로 AI 기능 강화 예정 [11] GPTMAGAZINE갤로그로 이동합니다. 05.13 6244 1
317 오픈AI, AI 생성 이미지 판별 기술 도입 [2] GPTMAGAZINE갤로그로 이동합니다. 05.09 2814 0
316 애플, M4 칩 기존 M2 대비 50% 성능 향상 [40] GPTMAGAZINE갤로그로 이동합니다. 05.08 6898 6
315 애플, 1100억 달러 규모 자사주 매입 결정.. AI 탑재 신제품 예고 [5] GPTMAGAZINE갤로그로 이동합니다. 05.03 6227 3
314 애플, AI 개발 위해 스위스에 비공개 연구소 구축 [4] GPTMAGAZINE갤로그로 이동합니다. 05.02 2609 3
313 SKT, 통신 분야 최적화된 'AI 멀티엔진' 개발 착수 [1] GPTMAGAZINE갤로그로 이동합니다. 05.02 612 1
312 마이크로소프트, AI 전력 확보 위해 재생에너지에 14조 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 05.02 5895 4
311 깃허브, 개발자의 코드 작성부터 테스트까지 지원하는 AI 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 04.30 3189 3
310 인텔, 삼성, 네이버의 연합으로 새로운 AI 생태계의 출범 [36] GPTMAGAZINE갤로그로 이동합니다. 04.29 6243 19
309 메타, ‘라마 3’ 와 ‘메타 AI’ 오픈소스 공개 [6] GPTMAGAZINE갤로그로 이동합니다. 04.25 3197 1
308 어도비, 창의적 AI 모델인 'Firefly Image 3' 공개 [15] GPTMAGAZINE갤로그로 이동합니다. 04.24 6300 2
307 업스테이지, 1000억 원 투자 유치로 글로벌 AI 시장 진출 가속화 [3] GPTMAGAZINE갤로그로 이동합니다. 04.23 2676 1
306 일본 소프트뱅크, '챗GPT 잡기' 위한 통큰 투자 전략 공개 [13] GPTMAGAZINE갤로그로 이동합니다. 04.23 6087 7
305 중국 바이두, 챗GPT 넘어서기 위한 대규모 개발 도전 GPTMAGAZINE갤로그로 이동합니다. 04.23 514 0
304 영국 작가협회, 번역 AI로 인한 번역가 일자리 감소 및 소득 하락 [18] GPTMAGAZINE갤로그로 이동합니다. 04.23 3442 8
303 텐센트AI, 3조 토큰의 파워로 오픈AI 압도하나 [3] GPTMAGAZINE갤로그로 이동합니다. 04.22 2753 0
302 마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환 [14] GPTMAGAZINE갤로그로 이동합니다. 04.22 7301 6
301 구글, 코카콜라와 로레알 AI광고 파트너십 체결 GPTMAGAZINE갤로그로 이동합니다. 04.15 2234 1
300 구글 , 신형 ‘제미나이 1.5 프로' 도입으로 개발시간 40% 단축 GPTMAGAZINE갤로그로 이동합니다. 04.11 883 3
299 오픈AI, 챗GPT 내 DALL-E 이미지 편집 기능 업데이트 발표 [1] GPTMAGAZINE갤로그로 이동합니다. 04.04 5261 3
295 챗GPT 이제 계정 없이도 자유롭게! 오픈AI의 대대적 접근성 향상 전략 [5] GPTMAGAZINE갤로그로 이동합니다. 04.03 6783 9
294 오픈AI, 이달 일본 도쿄에 아시아 첫 거점 개설 [6] GPTMAGAZINE갤로그로 이동합니다. 04.02 1584 5
293 MS-오픈AI, 슈퍼컴퓨터 구축에 135조 원 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 04.01 5414 9
292 실리콘밸리 최상급 AI 전문가, 연봉 13억 이상으로 급상승 GPTMAGAZINE갤로그로 이동합니다. 03.28 1674 2
291 오픈AI, Sora를 통한 크리에이터들의 첫 작품 공개 [4] GPTMAGAZINE갤로그로 이동합니다. 03.27 1711 2
290 청소년, 음란 AI 챗봇에 쉽게 접근 무방비 노출 [40] GPTMAGAZINE갤로그로 이동합니다. 03.26 3227 0
289 애플, 바이두 AI 기술 도입 검토 [31] GPTMAGAZINE갤로그로 이동합니다. 03.26 3164 11
288 오픈AI, 새로운 AI 음성 비서 출시 예정 [6] GPTMAGAZINE갤로그로 이동합니다. 03.25 5342 0
287 블랙웰의 등장과 AI의 확장, 기독교적 복음의 전달 [1] GPTMAGAZINE갤로그로 이동합니다. 03.22 1014 0
286 오픈AI, GPT-5 올 여름 출시 예정 [11] GPTMAGAZINE갤로그로 이동합니다. 03.21 3663 9
285 애플, 구글과 차세대 아이폰에 생성 AI 탑재를 위한 협력 모색 [8] GPTMAGAZINE갤로그로 이동합니다. 03.20 5175 4
284 xAI, 새로운 AI 모델 Grok-1 발표 [2] GPTMAGAZINE갤로그로 이동합니다. 03.18 1519 0
283 MS, 전 세계 코파일럿 프로 출시와 함께 1개월 무료 체험 제공 [18] GPTMAGAZINE갤로그로 이동합니다. 03.15 5914 5
282 오픈AI, 소라AI 올해 안에 공개 예정 [18] GPTMAGAZINE갤로그로 이동합니다. 03.14 3193 4
281 국내 AI 대체 가능 일자리 327만개…60%는 전문직 집중 포진 [27] GPTMAGAZINE갤로그로 이동합니다. 03.13 2595 5
280 일론 머스크, xAI의 챗봇 '그록' 오픈소스로 공개 예정 [15] GPTMAGAZINE갤로그로 이동합니다. 03.12 5431 6
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2