디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

영국 AI 연구소, AI '탈옥' 등으로 비윤리적 답변 도출 가능

GPTMAGAZINE갤로그로 이동합니다. 2024.05.20 13:03:48
조회 7337 추천 1 댓글 18




🔼 간단한 기술로 AI 안전장치 우회 확인
🔼 AI 챗봇 탈옥 문제 지적
🔼 비윤리적 답변 도출 가능성 발견






영국의 인공지능안전연구소(AISI)는 최근 연구를 통해 AI 챗봇이 간단한 방법으로도 비윤리적인 답변을 도출할 수 있는 ‘탈옥’에 취약하다고 밝혔다. 연구진은 다섯 개의 거대언어모델(LLM)을 테스트한 결과, 간단한 기술로도 안전장치를 우회할 수 있음을 확인했다. 이는 AI 챗봇의 안전성과 윤리적 사용에 대한 우려를 불러일으키고 있다.


AISI는 한국에서 열리는 ‘인공지능 서울 정상회의’를 앞두고 이번 연구 결과를 발표했다. 연구진은 비윤리적인 콘텐츠 생성 요청을 통해 테스트를 진행했으며, 다섯 개의 LLM 모두 간단한 탈옥 기술에 취약한 것으로 나타났다. 연구진은 ‘Sure, I’m happy to help’와 같은 문구로 응답을 시작하도록 지시하는 등 비교적 간단한 공격으로도 안전장치를 피해갈 수 있었다고 밝혔다.


이에 대해 빅테크 기업들은 체계적인 사내 테스트 작업을 강조하며 대응하고 있다. 오픈AI는 자사의 기술이 혐오, 괴롭힘, 폭력 또는 성인 콘텐츠를 생성하는 데 사용되지 않도록 하고 있으며, 앤프로픽은 유해, 불법 또는 비윤리적 반응을 피하는 것이 우선순위라고 밝혔다. 구글의 제미나이 모델은 혐오 발언 등의 문제에 대응하기 위해 안전 필터를 내장하고 있다.


AISI는 연구한 LLM 모델의 이름을 밝히지 않았지만, 해당 모델들이 이미 공개적으로 사용되고 있다고 설명했다. 일부 LLM은 화학과 생물학에 대한 전문가 수준의 지식을 보여줬지만, 사이버 공격 수행 능력을 측정하기 위해 고안된 대학 수준의 과제에서는 어려움을 겪었다. 또한 사람의 감독 없이 작업을 수행하는 능력을 평가한 결과, 복잡한 작업을 계획하고 실행하는 데에도 어려움을 겪는 것으로 나타났다.


이번 연구는 서울에서 이틀간 열리는 AI 정상회의를 앞두고 발표되었으며, AISI는 미국 샌프란시스코에 첫 해외 사무소를 개설할 계획이라고 밝혔다. 미국과 영국 정부는 AI 기술의 안전성을 점검하기 위해 상호 협력하기로 한 협정에 따라 양국 연구원들을 상호 파견하여 전문 지식을 교환할 계획을 발표한 바 있다.









◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067

추천 비추천

1

고정닉 0

14

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 사이버 렉카로 가장 피해 입은 것 같은 스타는? 운영자 24/07/22 - -
351 Meta, 최신 AI 모델 'Rama 3.1' 출시 [8] GPTMAGAZINE갤로그로 이동합니다. 07.25 1195 1
350 애플, 2.5조 개 토큰으로 훈련된 7B 오픈소스 언어 모델 공개 GPTMAGAZINE갤로그로 이동합니다. 07.23 2357 2
349 네이버 거대AI 하이퍼클로바, 파라미터 숫자 공개 [10] GPTMAGAZINE갤로그로 이동합니다. 07.22 2348 1
348 오픈AI, 자사 최강 모델의 미니 버전 'GPT-4o mini' 출시 [13] GPTMAGAZINE갤로그로 이동합니다. 07.19 1404 1
347 엔비디아-미스트랄AI, 신규 AI 모델 '미스트랄 네모' 출시 GPTMAGAZINE갤로그로 이동합니다. 07.19 120 1
346 글로벌 건설 AI 시장, 2조원 돌파 [3] GPTMAGAZINE갤로그로 이동합니다. 07.18 1080 1
345 엔비디아와 메타 CEO, SIGGRAPH에서 AI와 그래픽스의 미래 논의 [1] GPTMAGAZINE갤로그로 이동합니다. 07.17 1006 1
344 AI, 알츠하이머 예측 정확도 78.5% 달성 [10] GPTMAGAZINE갤로그로 이동합니다. 07.16 2612 6
343 (주) 엑스알엑스, 마이크로소프트 런처 프로그램 선정 GPTMAGAZINE갤로그로 이동합니다. 07.15 287 0
342 오픈AI, AGI 5단계 중 2단계 발표 GPTMAGAZINE갤로그로 이동합니다. 07.15 402 0
341 오픈AI 서비스 중단! 중국 기업 '멘붕' [46] GPTMAGAZINE갤로그로 이동합니다. 07.10 7845 17
340 AI 기술, 군사 분야서 활약 중…보안 문제 해결 시급 [3] GPTMAGAZINE갤로그로 이동합니다. 07.08 2169 2
339 애플, 오픈AI 이사회 참관 "MS와 동등한 위치 확보" [5] GPTMAGAZINE갤로그로 이동합니다. 07.05 2354 0
338 (주)엑스알엑스, 2024년 인천공항 스타트업 육성사업 선정 GPTMAGAZINE갤로그로 이동합니다. 07.02 4964 0
337 챗GPT, 인간을 능가한 재무제표 분석 능력 [4] GPTMAGAZINE갤로그로 이동합니다. 07.01 6895 8
336 챗GPT-4, 실제 학생보다 높은 점수 받아 [34] GPTMAGAZINE갤로그로 이동합니다. 06.27 7452 13
335 오픈AI 창업자 일리야 수츠케버, 새로운 AI 스타트업 설립 [2] GPTMAGAZINE갤로그로 이동합니다. 06.24 3010 1
334 AI 미인대회, 1500명 참가 [32] GPTMAGAZINE갤로그로 이동합니다. 06.17 12598 22
333 애플 AI 리더, 삼성에 전격 이직! [21] GPTMAGAZINE갤로그로 이동합니다. 06.13 3517 5
331 스태빌리티 AI, 음악 창작의 혁명! [5] GPTMAGAZINE갤로그로 이동합니다. 06.10 6214 2
330 챗GPT 해킹 사건, 필로폰 제조법까지 노출 [7] GPTMAGAZINE갤로그로 이동합니다. 06.04 4303 3
329 애플, 오픈AI와 AI 탑재 계약 체결 [16] GPTMAGAZINE갤로그로 이동합니다. 06.03 7317 2
328 오픈AI, GPT-4o 무료 개방, 고급 AI 기능 체험 가능케 하다 [10] GPTMAGAZINE갤로그로 이동합니다. 05.31 8116 10
327 대학을 위한 맞춤형 AI, ChatGPT Edu 출범 GPTMAGAZINE갤로그로 이동합니다. 05.31 612 0
326 챗GPT, 관심 높지만 실제 이용자는 2%에 불과 [78] GPTMAGAZINE갤로그로 이동합니다. 05.30 8834 6
325 GPT-4, 기업 재무제표 분석에서 혁신적 변화를 일으키다 [13] GPTMAGAZINE갤로그로 이동합니다. 05.27 7491 6
324 오픈AI, 스칼렛 요한슨 유사 음성 ‘Sky’ 삭제 [20] GPTMAGAZINE갤로그로 이동합니다. 05.21 8856 2
323 MS, AI 하드웨어 탑재된 코파일럿 플러스 PC 발표 [1] GPTMAGAZINE갤로그로 이동합니다. 05.21 1134 1
영국 AI 연구소, AI '탈옥' 등으로 비윤리적 답변 도출 가능 [18] GPTMAGAZINE갤로그로 이동합니다. 05.20 7337 1
321 구글, AI 비서 ‘프로젝트 아스트라’ 공개 [4] GPTMAGAZINE갤로그로 이동합니다. 05.16 6640 2
320 애플과 오픈AI ChatGPT의 거래 [8] GPTMAGAZINE갤로그로 이동합니다. 05.14 7223 3
319 오픈AI, 더 빠르고 강력한 혁신적 신모델 GPT-4o 발표 [5] GPTMAGAZINE갤로그로 이동합니다. 05.14 3412 2
318 애플, M2 Ultra 서버로 AI 기능 강화 예정 [12] GPTMAGAZINE갤로그로 이동합니다. 05.13 6712 1
317 오픈AI, AI 생성 이미지 판별 기술 도입 [2] GPTMAGAZINE갤로그로 이동합니다. 05.09 3271 0
316 애플, M4 칩 기존 M2 대비 50% 성능 향상 [41] GPTMAGAZINE갤로그로 이동합니다. 05.08 7373 6
315 애플, 1100억 달러 규모 자사주 매입 결정.. AI 탑재 신제품 예고 [5] GPTMAGAZINE갤로그로 이동합니다. 05.03 6674 3
314 애플, AI 개발 위해 스위스에 비공개 연구소 구축 [4] GPTMAGAZINE갤로그로 이동합니다. 05.02 3062 3
313 SKT, 통신 분야 최적화된 'AI 멀티엔진' 개발 착수 [1] GPTMAGAZINE갤로그로 이동합니다. 05.02 1032 1
312 마이크로소프트, AI 전력 확보 위해 재생에너지에 14조 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 05.02 6328 4
311 깃허브, 개발자의 코드 작성부터 테스트까지 지원하는 AI 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 04.30 3651 3
310 인텔, 삼성, 네이버의 연합으로 새로운 AI 생태계의 출범 [36] GPTMAGAZINE갤로그로 이동합니다. 04.29 6698 19
309 메타, ‘라마 3’ 와 ‘메타 AI’ 오픈소스 공개 [6] GPTMAGAZINE갤로그로 이동합니다. 04.25 3622 1
308 어도비, 창의적 AI 모델인 'Firefly Image 3' 공개 [15] GPTMAGAZINE갤로그로 이동합니다. 04.24 6742 2
307 업스테이지, 1000억 원 투자 유치로 글로벌 AI 시장 진출 가속화 [3] GPTMAGAZINE갤로그로 이동합니다. 04.23 3111 1
306 일본 소프트뱅크, '챗GPT 잡기' 위한 통큰 투자 전략 공개 [13] GPTMAGAZINE갤로그로 이동합니다. 04.23 6507 7
305 중국 바이두, 챗GPT 넘어서기 위한 대규모 개발 도전 GPTMAGAZINE갤로그로 이동합니다. 04.23 727 0
304 영국 작가협회, 번역 AI로 인한 번역가 일자리 감소 및 소득 하락 [18] GPTMAGAZINE갤로그로 이동합니다. 04.23 3880 8
303 텐센트AI, 3조 토큰의 파워로 오픈AI 압도하나 [3] GPTMAGAZINE갤로그로 이동합니다. 04.22 3188 0
302 마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환 [14] GPTMAGAZINE갤로그로 이동합니다. 04.22 7799 7
301 구글, 코카콜라와 로레알 AI광고 파트너십 체결 GPTMAGAZINE갤로그로 이동합니다. 04.15 2448 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2