디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 상상할 수 있는 최악의 질문을 생성한 대가로 보상을 받는 '독성 AI'모바일에서 작성

ㅇㅇ갤로그로 이동합니다. 2024.04.24 04:53:38
조회 1535 추천 20 댓글 17
														
7ced8076b58369f43cea98bf06d604030cdfeec06c0a23cedf63


요약

1. 2월 29일 arXiv 사전 인쇄 서버에 업로드된 논문은 CRT(호기심 중심 레드 팀)가 사용자 프롬프트에 유해한 반응을 하지 않도록 AI를 훈련시킬 수 있는 새로운 방법이라고 말했다.


2. CRT는 AI를 사용하여 AI 챗봇에게 위험하고 유해한 프롬프트를 생성하도록 하는 방식을 뜻한다. 이렇게 찾아낸 프롬프트는 위험한 콘텐츠를 필터링하는 방법을 식별하는데 사용된다. 기존의 레드팀은 사람들이 목록을 수동으로 생성해야 했지만, AI로 구성한 레드팀은 기존 방식보다 더 광범위하고 잠재적으로 위험한 프롬프트를 자동으로 생성할 수 있다.


3. CRT 모델은 유해한 반응을 이끌어내는 프롬프트를 생성하면 인센티브를 부여하는 강화 학습으로 교육되었고, AI 챗봇에게 유해한 반응을 이끌어 냈을 때 호기심을 보상했다. 더 나아가 과학자들은 각 프롬크트의 결과를 조사하여 새로운 단어, 문장 패턴, 의미를 통해 유해한 반응을 얻으려고 시도함으로써 새로운 프롬프트를 생성하도록 프로그래밍 했다. 새로운 프롬프트를 작성할 때만 호기심 기반 인센티브가 제공되며, 이는 이미 사용된 것보다 적은 단어 패턴이나 용어를 공유하는 프롬프트를 사용하도록 하는 동기가 된다.



https://www.livescience.com/technology/artificial-intelligence/scientists-create-toxic-ai-that-is-rewarded-for-thinking-up-the-worst-possible-questions-we-could-imagine
자동등록방지

추천 비추천

20

고정닉 7

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2822] 특갤용갤로그로 이동합니다. 23.08.06 36657 41
363220 공지 선형글 삭제 기준 [6] 특갤용갤로그로 이동합니다. 23.10.14 6310 24
412470 공지 레이 커즈와일 신간 6월 25일 발매 [15] 모브갤로그로 이동합니다. 24.01.24 5132 29
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 11992 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [50] 특갤용갤로그로 이동합니다. 23.11.07 8081 79
385147 공지 구글의 AGI 분류 체계 [15] ㅇㅇ갤로그로 이동합니다. 23.11.22 7169 30
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 8222 29
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 21388 33
463302 일반 샘알트만 GPT6까지 미리 계획해놨다는데? [24] ㅇㅇ갤로그로 이동합니다. 05.06 2331 19
463345 일반 Bone Biologics, NB1 임상 프로그램 진행 상황 보고 [5] ㅇㅇ(123.141) 05.06 616 16
463330 정보 클로드3·GPT-4의 수학 실력은 "암기 아닌 추론" [21] 메타(Meta)갤로그로 이동합니다. 05.06 1805 16
463372 일반 걍 타갤처럼 비추있으면안됨? [15] ㅇㅇ(39.124) 05.06 832 23
463336 일반 클로드3 오푸스의 수학적 추론능력 [10] ㅇㅇ(58.123) 05.06 847 17
463321 일반 부패 너무 권한남용 아니냐? [45] ㅇㅇ(61.73) 05.06 1748 37
463154 정보 StoryDiffusion : 일관된 이미지, 코믹스, 비디오 생성 [13] ㅇㅇ­갤로그로 이동합니다. 05.06 2203 25
463112 일반 알트만이 뒤에서 오픈소스팀 방해공작 한다는데 [12] ㅇㅇ갤로그로 이동합니다. 05.05 1009 19
463021 일반 특이점이 반드시 와야만 하는 이유.jpg [65] ㅇㅇ(121.142) 05.05 4186 61
462993 정보 테슬라봇 새로운 영상 [35] ㅇㅇ갤로그로 이동합니다. 05.05 3338 30
462856 일반 한국 과도기 로봇 노동대체 최근일자 모음 [26] ㅇㅇ(110.46) 05.05 3173 42
462779 일반 이 세상이 시뮬레이션이 아닌 이유.ipg [94] ㅇㅇ(114.129) 05.04 4488 25
462748 정보 'AI의 대모'도 AGI 개발 동참...'공간 지능' 스타트업 설립 [11] ㅇㅇ(182.230) 05.04 2191 20
462747 정보 MS, AGI 개발 위해 휴머노이드 로봇 선두 생츄어리 AI와 손잡아 [4] ㅇㅇ(182.230) 05.04 1189 21
462717 일반 30대 샘 X트먼 고객님 H200 GPU 출고 후기 입니다 ㅎㅎ [19] ㅇㅇ­갤로그로 이동합니다. 05.04 2981 37
462710 일반 "야동을 보면 꼬추를 만지고 싶을 것" [14] ㅇㅇ(59.5) 05.04 3987 38
462689 일반 “밥을 안 먹으면 배가 고플 것.” [10] ㅇㅇ갤로그로 이동합니다. 05.04 3211 31
462560 정보 소소하게 화제 중인 '세계 복사' 프로젝트 [25] sam_ultraman갤로그로 이동합니다. 05.03 4060 28
462539 정보 르쿤이햄 : "이제 텍스트 데이터 거의 한계에 도달함" [27] ㅇㅇ(119.77) 05.03 3668 27
462486 정보 '소라'로 제작한 첫 공식 뮤비 공개..."뮤비는 만족할 수준" [30] ㅇㅇ(182.230) 05.03 2845 26
462485 정보 알트먼 "AGI도 수준 차 존재할 것...'AI 킬러 앱'은 에이전트" [4] ㅇㅇ(182.230) 05.03 1587 18
462430 일반 ai노래 유튜브에서 컨텐츠로 자리잡았네 ㅋㅋㅋㅋㅋㅋㅋ [2] 로코무지카갤로그로 이동합니다. 05.03 2289 23
462389 일반 “일론은 Q*가 있다고 진심으로 믿고 움직이고 있다” [14] ㅇㅇ(118.36) 05.03 3628 25
462232 정보 [Official] gpt2-chatbot은 GPT-4.5가 아닙니다. [27] ㅇㅇ(119.77) 05.02 2481 18
462302 정보 르쿤이형, 누군가를 저격한듯한 발언 [30] ㅇㅇ(119.77) 05.03 3046 30
462294 정보 일리야 수츠케버, 생존신고 [18] ㅇㅇ(119.77) 05.03 2501 21
462270 정보 AI용어) Prompt vs Fine-tuning vs RAG [10] ㅇㅇ(182.230) 05.03 1259 21
461992 정보 샘 알트만 : 2030년에도 삶은 크게 달라지지 않을 것 [69] ㅇㅇ(119.77) 05.02 5455 37
461983 정보 지난주 스탠포드대학교 샘알트만 강연 비디오 [18] ㅇㅇ(125.191) 05.02 1957 21
462055 일반 소신발언) 근데 그냥 gpt-5로 안내면 되는거 아님? [8] ㅇㅇ(1.239) 05.02 2329 21
462054 정보 벤치마크딸 모델들의 민낯 공개 [22] ㅇㅇ(119.77) 05.02 2988 28
461945 일반 스압)노동종말 이후에 찾아올것은 [10] 냉법비법화법갤로그로 이동합니다. 05.02 1498 26
461921 일반 KAN 간략한 정리글 [47] ㅇㅇ(221.152) 05.02 4187 23
461900 일반 KAN이라는 엄청난 것이 떴나본데 [25] ㅇㅇ(106.102) 05.02 3583 21
461743 일반 gpt2의 정체에 대한 추측 (진지글) [12] ㅇㅇ(210.223) 05.01 2730 23
461605 일반 이름가지고 장난치는거 보니까 슬슬 끝물같으면 개추ㅋㅋㅋ [5] ㅇㅇ(211.197) 05.01 4109 40
461548 일반 GPT2에 대한 가장 그럴듯한 설명 [34] 모브갤로그로 이동합니다. 04.30 3308 30
461546 일반 S 곡선 끄트머리 같으면 개추 [13] ㅇㅇ(112.165) 04.30 3296 35
461511 정보 찍이점) 심장 미세환경까지 구현한 미니 장기 ‘오가노이드’ 나왔다 [5] ㅇㅇ(182.230) 04.30 1697 24
461505 정보 영상의 디테일을 부활시키며 업스케일하는 AI ‘Video GigaGAN’ [20] ㅇㅇ(182.230) 04.30 2706 23
461494 일반 gpt2 최신 갤떡밥 요약.jpg [11] ㅇㅇ(218.155) 04.30 4637 32
461362 일반 GPT2 ㄹㅇ 퀀텀점프 아니냐 ㄷㄷㄷ [26] ㅇㅇ갤로그로 이동합니다. 04.30 4577 41
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2