디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 상상할 수 있는 최악의 질문을 생성한 대가로 보상을 받는 '독성 AI'모바일에서 작성

ㅇㅇ갤로그로 이동합니다. 2024.04.24 04:53:38
조회 1527 추천 20 댓글 17
														
7ced8076b58369f43cea98bf06d604030cdfeec06c0a23cedf63


요약

1. 2월 29일 arXiv 사전 인쇄 서버에 업로드된 논문은 CRT(호기심 중심 레드 팀)가 사용자 프롬프트에 유해한 반응을 하지 않도록 AI를 훈련시킬 수 있는 새로운 방법이라고 말했다.


2. CRT는 AI를 사용하여 AI 챗봇에게 위험하고 유해한 프롬프트를 생성하도록 하는 방식을 뜻한다. 이렇게 찾아낸 프롬프트는 위험한 콘텐츠를 필터링하는 방법을 식별하는데 사용된다. 기존의 레드팀은 사람들이 목록을 수동으로 생성해야 했지만, AI로 구성한 레드팀은 기존 방식보다 더 광범위하고 잠재적으로 위험한 프롬프트를 자동으로 생성할 수 있다.


3. CRT 모델은 유해한 반응을 이끌어내는 프롬프트를 생성하면 인센티브를 부여하는 강화 학습으로 교육되었고, AI 챗봇에게 유해한 반응을 이끌어 냈을 때 호기심을 보상했다. 더 나아가 과학자들은 각 프롬크트의 결과를 조사하여 새로운 단어, 문장 패턴, 의미를 통해 유해한 반응을 얻으려고 시도함으로써 새로운 프롬프트를 생성하도록 프로그래밍 했다. 새로운 프롬프트를 작성할 때만 호기심 기반 인센티브가 제공되며, 이는 이미 사용된 것보다 적은 단어 패턴이나 용어를 공유하는 프롬프트를 사용하도록 하는 동기가 된다.



https://www.livescience.com/technology/artificial-intelligence/scientists-create-toxic-ai-that-is-rewarded-for-thinking-up-the-worst-possible-questions-we-could-imagine
자동등록방지

추천 비추천

20

고정닉 7

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
462981 일반 GTA6 유출 떴다!! [9] ㅇㅇ갤로그로 이동합니다. 05.05 446 2
462979 일반 ms 이새끼들 phi3 7b하고 14b 왜 공개 안하는겨 [1] ㅇㅇ(110.145) 05.05 70 0
462977 일반 진짜 agi 안 나오면 우리 다 죽게 생겼네 [1] ㅇㅇ(211.59) 05.05 198 0
462974 일반 gpt4에 그림으로 물어볼수는 없냐? [2] ㅇㅇ(116.90) 05.05 66 0
462971 일반 2023agi는 특갤럼들 오바한거고 정식은 25부터임 [1] ㅇㅇ(59.11) 05.05 83 0
462970 일반 GPT-5특징) 조만간 안 나옴 ㅇㅇ(120.142) 05.05 112 1
462966 일반 워터마크 떡밥 싹 밀어다오 [1] ㅇㅇ갤로그로 이동합니다. 05.05 78 1
462965 일반 도파민 디톡스 고수 있음? 커뮤니티도 끊어야 함? [4] ㅇㅇ(118.37) 05.05 155 0
462963 일반 살인범들은 역노화 영생 이런거 못하게 금지해야됨 [5] ㅇㅇ(59.11) 05.05 161 1
462962 일반 저런 소식 들려오면 오히려 좋다 ㅇㅇ(119.77) 05.05 50 0
462961 일반 ai 그림 워터마크 악용 가능성도 있지 않을까 싶음. [2] ㅇㅇ(125.134) 05.05 123 0
462959 일반 이때는 2023 agi 정배였음? [7] ㅇㅇ(221.154) 05.05 185 0
462958 일반 나이트쉐이드,글레이즈인가 ai오염시키는 프로그램 그거 어케됨? [4] ㅇㅇ(1.246) 05.05 113 0
462957 일반 CHATGPT5 언제와용 ㅇㅇ(1.239) 05.05 24 0
462956 일반 갑자기 화나네 [2] ㅇㅇ(112.186) 05.05 138 0
462955 AI창 이게 워터마크 박힐 제 ai 딸깍임 [6] Samus갤로그로 이동합니다. 05.05 247 2
462953 일반 오픈ai 직원이 줄어들면 agi가 임박했다는 신호임 [2] ㅇㅇ(175.124) 05.05 244 1
462952 일반 특갤만화 재업) 그림쟁이 좆됐다!! [5] ㅇㅇ(1.237) 05.05 237 1
462951 일반 ㅌㅇㅈ ㅈㅂ 198ㅇㅊ [3] ㅇㅇ갤로그로 이동합니다. 05.05 48 0
462950 일반 가면 쓸 생각도 없는거 맞지? ㅇㅇ(59.21) 05.05 51 1
462949 일반 이게 뭔개소리임? [4] ㅇㅇ갤로그로 이동합니다. 05.05 216 1
462948 일반 결론 기승전알트만임? ㅋㅋ ㅇㅇ(103.237) 05.05 50 0
462947 일반 이상하다 적어도 최근 9달정도동안 특갤에서 [4] ㅇㅇ(49.170) 05.05 272 8
462946 일반 이게 다 알트만 때문이다 ㅇㅇ(1.237) 05.05 29 0
462945 일반 그냥 워터마크 떡밥 미는게 나아보이지 않음? [5] 부패하는유전자!!!갤로그로 이동합니다. 05.05 183 0
462943 일반 워터마크 규제에 대해선 반대하는 입장임. ㅇㅇ(1.239) 05.05 53 1
462942 일반 상업적 이용에 ai그림 여부 필수 기재는 해야,,,,,,,,, Samus갤로그로 이동합니다. 05.05 88 0
462941 일반 이게 다 알트만때문임 Jackey갤로그로 이동합니다. 05.05 25 0
462940 일반 gpt5 출시해도 [2] ㅇㅇ(61.108) 05.05 141 0
462939 일반 여기가 시뮬레이션 세계라도 우리들은 절대 간파못하지 [1] ㅇㅇ(59.11) 05.05 57 0
462938 일반 워터마크 안 박았다고 처벌을 해야한다는게 말이 됨? ㅇㅇ(118.131) 05.05 60 0
462937 일반 ai그림이라고 딱지붙여도 잘팔리면 그거 나름대로 볼만할듯 ㅋㅋ [2] ㅇㅇ(1.237) 05.05 72 0
462936 일반 나 12만 유튜버인데 솔직히 ai꿀 존나 열심히 빨았음 [14] lightvector갤로그로 이동합니다. 05.05 501 8
462935 일반 지금 저거 옹호하는 병신들은 분탕이라 보면 됨 ㅋㅋ [2] ㅇㅇ(61.80) 05.05 84 0
462932 일반 언제쯤이면 ai가 가치판단을 할 수 있을까 ㅇㅇ(125.136) 05.05 28 0
462931 일반 어차피 지우는데 왜 함<<의무화 뜻을 모르는 거임? [7] ㅇㅇ(116.120) 05.05 103 0
462929 일반 한두달 뒤 여름인데 [1] ㅇㅇ갤로그로 이동합니다. 05.05 68 0
462927 일반 지금 가장 타격 받고 있는 건 콜센터 쪽인가? [1] ㅇㅇ(103.237) 05.05 57 0
462925 일반 지금 ai 구독 하나 해버려하는데 어떤게 가장 나음? [5] noosphere갤로그로 이동합니다. 05.05 120 0
462921 일반 지금 AI 근황 어떰? 빙하기임? [2] ㅇㅇ(218.50) 05.05 215 1
462919 일반 드디어 이번주가 왔구나 [1] ㅇㅇ(119.77) 05.05 73 0
462918 일반 우우...트뿌이 힘드롱... [3] ㅇㅇ(1.239) 05.05 83 0
462916 일반 뉴럴링크 수술 예시비디오 [2] 투우사갤로그로 이동합니다. 05.05 238 0
462914 일반 뉴럴링크 1~2년안에 일반승인된다니 신기하네 [9] 친근한게이브갤로그로 이동합니다. 05.05 352 1
462911 일반 노동대체 내년안에 다될수있지?? [6] ㅇㅇ(220.65) 05.05 187 0
462909 일반 ai 가젯 또망 디붕이(121.190) 05.05 178 0
462908 일반 소설내용 써놓고 [2] ㅇㅇ(119.193) 05.05 143 0
462907 일반 지금 AI 노동대체는 과도기 최악의 시나리오긴 해 [1] ㅇㅇ(58.127) 05.05 169 1
462906 일반 인간은 데이터의 90%를 이미지 데이터로 뇌에 입력함. [9] ㅇㅇ(59.22) 05.05 242 0
462905 일반 전국민 교양과학 30권씩 의무독서 했으면 [6] ㅇㅇ(175.119) 05.05 232 2
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2