디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 상상할 수 있는 최악의 질문을 생성한 대가로 보상을 받는 '독성 AI'모바일에서 작성

ㅇㅇ갤로그로 이동합니다. 2024.04.24 04:53:38
조회 1573 추천 21 댓글 17
														
7ced8076b58369f43cea98bf06d604030cdfeec06c0a23cedf63


요약

1. 2월 29일 arXiv 사전 인쇄 서버에 업로드된 논문은 CRT(호기심 중심 레드 팀)가 사용자 프롬프트에 유해한 반응을 하지 않도록 AI를 훈련시킬 수 있는 새로운 방법이라고 말했다.


2. CRT는 AI를 사용하여 AI 챗봇에게 위험하고 유해한 프롬프트를 생성하도록 하는 방식을 뜻한다. 이렇게 찾아낸 프롬프트는 위험한 콘텐츠를 필터링하는 방법을 식별하는데 사용된다. 기존의 레드팀은 사람들이 목록을 수동으로 생성해야 했지만, AI로 구성한 레드팀은 기존 방식보다 더 광범위하고 잠재적으로 위험한 프롬프트를 자동으로 생성할 수 있다.


3. CRT 모델은 유해한 반응을 이끌어내는 프롬프트를 생성하면 인센티브를 부여하는 강화 학습으로 교육되었고, AI 챗봇에게 유해한 반응을 이끌어 냈을 때 호기심을 보상했다. 더 나아가 과학자들은 각 프롬크트의 결과를 조사하여 새로운 단어, 문장 패턴, 의미를 통해 유해한 반응을 얻으려고 시도함으로써 새로운 프롬프트를 생성하도록 프로그래밍 했다. 새로운 프롬프트를 작성할 때만 호기심 기반 인센티브가 제공되며, 이는 이미 사용된 것보다 적은 단어 패턴이나 용어를 공유하는 프롬프트를 사용하도록 하는 동기가 된다.



https://www.livescience.com/technology/artificial-intelligence/scientists-create-toxic-ai-that-is-rewarded-for-thinking-up-the-worst-possible-questions-we-could-imagine
자동등록방지

추천 비추천

21

고정닉 7

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
464957 일반 코딩 개초보가 GPT 로 고오급 웹사이트 만들기 [41] GPT PLUS(125.137) 05.10 4574 44
464910 일반 현재 갤 상황 요약...jpg [21] lightvector갤로그로 이동합니다. 05.09 4977 38
464863 일반 장문글)내가 특이점을 기다리는 이유...txt [33] ㅇㅇ(1.238) 05.09 3103 35
464749 일반 also gpt2 쓰레긴데? [9] ㅇㅇ(114.200) 05.09 1475 14
464601 일반 also-gpt2한테 샘알트만 비판하라고 해봤는데 [16] ㅇㅇ갤로그로 이동합니다. 05.09 3986 33
464599 일반 im-good과 also모델에게 실존 인물 비방을 시켜봤다. [9] 월코존버갤로그로 이동합니다. 05.09 2498 22
464597 정보/ 구글, ‘알파폴드3’ 네이처에 공개…정확도 1.5배, DNA까지 분석 [27] ㅇㅇ(125.191) 05.09 3316 30
464587 정보/ 알파폴드 3 발표 [22] ㅇㅇ(125.191) 05.09 3376 27
464357 일반 gpt2는 검색용모델일 확률이 높음 [5] ㅇㅇ(14.53) 05.08 3198 20
464341 정보/ AI가 신약 개발에 있어 획기적 성과를 거두는중 [18] ㅇㅇ(211.59) 05.08 3545 25
464249 일반 LLM방식은 한계가 있다고 말했던 얀르쿤이 옳았던것 같으면 개추 [13] ㅇㅇ(169.150) 05.08 3268 38
464125 일반 also-gpt2나 gpt2나 코딩 실력은 gpt4를 아득히 상회함 [8] Ad_Astra갤로그로 이동합니다. 05.08 4301 21
464124 일반 also good GPT2가 클로드 완전히 찢어갈기네 걍 [2] ㅇㅇ(121.124) 05.08 4188 20
464104 일반 와 also gpt2가 클로드 압살하네 ㅋㅋㅋ [1] 아몰라(223.62) 05.08 2832 16
464050 일반 트윗 ㅋㅋㅋ GPT2 요청 한번에 게임만들기 가능 [16] ㅇㅇ(14.63) 05.08 4247 30
464038 AI창 진짜 볼 수록 지리네 [25] ㅇㅇ(119.77) 05.07 5260 42
463983 일반 agi위해선 추론이 필수적인데 조금 짜치긴 하네... [18] lightvector갤로그로 이동합니다. 05.07 2950 25
463897 정보/ also gpt로 어려운 컴퓨터 비전 대회 성공했다 [38] ㅇㅇ(119.77) 05.07 3322 34
463804 일반 방금 점프에 장애물추가 콜리전추가 원큐에성공 ㅅㅂㅋㅋㅋㅋ [22] 친근한게이브갤로그로 이동합니다. 05.07 2527 28
463784 일반 also gpt2 미침 걍 agi 2단계임 영상있음 [7] 친근한게이브갤로그로 이동합니다. 05.07 3776 27
463783 일반 지리긴 하네..ㄷㄷ 소설도 뚝딱임 [13] 라익갤로그로 이동합니다. 05.07 3522 17
463742 일반 also gpt2 일단 확실한 거는 [7] ㅇㅇ(125.137) 05.07 3912 16
463666 AI창 재미로 클로드 gpt2 시 만들어보기 [3] 포스트휴먼.갤로그로 이동합니다. 05.07 1622 15
463659 일반 also vs gpt-4 한국어 시 테스트 [29] ㅇㅇ(182.213) 05.07 2793 32
463654 일반 GPT4 원래 이렇게 삐리했나? [13] 월코존버갤로그로 이동합니다. 05.07 2441 21
463649 일반 Also 미쳤는데 ㅋㅋㅋㅋ [1] 헬스토끼갤로그로 이동합니다. 05.07 3112 15
463627 일반 also gpt2 깔끔하네 [1] ㅇㅇ갤로그로 이동합니다. 05.07 2160 14
463603 일반 약간 충격받은 also gpt-2 후기 [12] 컴퓨터비전갤로그로 이동합니다. 05.07 4399 17
463597 일반 also gpt 진짜 미쳤는데? [2] ㅇㅇ갤로그로 이동합니다. 05.07 2575 12
463587 정보/ 아레나) gpt2, gpt-4, 클로드3 사칙연산 테스트 결과 [10] ㅇㅇ갤로그로 이동합니다. 05.07 2210 17
463584 일반 ㅋㅋGPT2 작문 실력 확실히 늘어나긴했네 [3] 월코존버갤로그로 이동합니다. 05.07 2019 22
463157 정보/ 올해 말까지 테슬라 옵티머스 DoF 업그레이드 [14] ㅇㅇ(119.77) 05.06 1788 13
463447 정보/ 마소CTO: OAI 모델, 전작들보다 훨씬 더 강력 등 [11] ㅇㅇ(119.77) 05.07 2105 16
463434 일반 llm 자체가 통계 머신이라 그런거 아니냐 [4] ㅇㅇ(1.223) 05.07 917 20
463302 일반 샘알트만 GPT6까지 미리 계획해놨다는데? [32] ㅇㅇ갤로그로 이동합니다. 05.06 4019 23
463345 일반 Bone Biologics, NB1 임상 프로그램 진행 상황 보고 [5] ㅇㅇ(123.141) 05.06 1141 23
463372 일반 걍 타갤처럼 비추있으면안됨? [22] ㅇㅇ(39.124) 05.06 1593 37
463336 일반 클로드3 오푸스의 수학적 추론능력 [11] ㅇㅇ(58.123) 05.06 1569 21
463321 일반 부패 너무 권한남용 아니냐? [46] ㅇㅇ(61.73) 05.06 2305 40
463154 정보/ StoryDiffusion : 일관된 이미지, 코믹스, 비디오 생성 [14] ㅇㅇ­갤로그로 이동합니다. 05.06 2670 26
463112 일반 알트만이 뒤에서 오픈소스팀 방해공작 한다는데 [12] ㅇㅇ갤로그로 이동합니다. 05.05 1631 19
463021 일반 특이점이 반드시 와야만 하는 이유.jpg [67] ㅇㅇ(121.142) 05.05 5235 64
462993 정보/ 테슬라봇 새로운 영상 [35] ㅇㅇ갤로그로 이동합니다. 05.05 3980 33
462856 일반 한국 과도기 로봇 노동대체 최근일자 모음 [25] ㅇㅇ(110.46) 05.05 3863 45
462779 일반 이 세상이 시뮬레이션이 아닌 이유.ipg [96] ㅇㅇ(114.129) 05.04 5297 25
462748 정보/ 'AI의 대모'도 AGI 개발 동참...'공간 지능' 스타트업 설립 [11] ㅇㅇ(182.230) 05.04 2543 20
462747 정보/ MS, AGI 개발 위해 휴머노이드 로봇 선두 생츄어리 AI와 손잡아 [4] ㅇㅇ(182.230) 05.04 1348 21
462719 정보/ AI가 코딩 더 잘해"…신입 개발자 '구직난' [8] ㅇㅇ(223.38) 05.04 598 14
462717 일반 30대 샘 X트먼 고객님 H200 GPU 출고 후기 입니다 ㅎㅎ [18] ㅇㅇ­갤로그로 이동합니다. 05.04 3312 37
462710 일반 "야동을 보면 꼬추를 만지고 싶을 것" [14] ㅇㅇ(59.5) 05.04 4806 41
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2