디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 명령어 계층 구조: 권한 있는 명령어의 우선순위를 지정하기 위한 LLM 모바일에서 작성

특술람갤로그로 이동합니다. 2024.04.23 12:18:10
조회 118 추천 5 댓글 1
														
7ced8076b5836af53ce998bf06d6040399f845e70b4ac546c0




https://arxiv.org/abs/2404.13208

 


오늘날의 LLM은 프롬프트 주입, 탈옥 및 공격자가 모델의 원래 지침을 자신의 악성 프롬프트로 덮어쓸 수 있는 기타 공격에 취약합니다. 이 작업에서 우리는 LLM이 시스템 프롬프트(예: 애플리케이션 개발자의 텍스트)를 신뢰할 수 없는 사용자 및 제3자의 텍스트와 동일한 우선순위로 간주하는 경우가 많다는 것이 이러한 공격의 근본적인 취약점 중 하나라고 주장합니다. 이 문제를 해결하기 위해 우리는 서로 다른 우선순위의 명령어가 충돌할 때 모델이 어떻게 작동해야 하는지를 명시적으로 정의하는 명령어 계층 구조를 제안합니다. 그런 다음 LLM이 낮은 권한의 명령을 선택적으로 무시하도록 가르치는 동작을 따르는 계층적 명령을 보여주기 위한 데이터 생성 방법을 제안합니다. 우리는 이 방법을 GPT-3.5에 적용하여 훈련 중에 보이지 않는 공격 유형에 대해서도 견고성을 대폭 향상시키면서 표준 기능의 저하를 최소화한다는 것을 보여줍니다.

자동등록방지

추천 비추천

5

고정닉 3

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
474523 일반 가면갈수록 구글에서 호들갑 떤 새끼는 뭐였을까 싶다 [1] ㅇㅇ(121.128) 05.15 134 0
474521 일반 난 여전히 클로드가 좋음 [2] ㅇㅇ갤로그로 이동합니다. 05.15 164 0
474520 일반 결국 핵심은 일리야 아니었나 ㅇㅇ(121.144) 05.15 46 0
474519 일반 근데 이러면 gpt5는 언제 낸다는걸까 [3] ㅇㅇ(180.182) 05.15 137 0
474518 일반 일리야 앤트로픽 합류 <<< 갤 뒤집어지냐? [5] ㅇㅇ갤로그로 이동합니다. 05.15 199 0
474517 일반 인류가 밝힌 자연의 법칙은 ㅇㅇ(121.186) 05.15 44 0
474516 일반 본인리 레커단이면 개추 ㅇㅇ(121.128) 05.15 27 0
474515 일반 수직충들의패배다 특이점은 점진적으로온다 ㅇㅇ(14.53) 05.15 74 1
474514 일반 끓는물 개구리 이거 볼때마다 좀 어지러움 [1] ㅇㅇ(121.144) 05.15 118 0
474513 일반 우리 모두가 예상한 시나리오는 이거거든? [10] ㅇㅇ(117.20) 05.15 240 0
474511 일반 갈수록 오픈ai가 4 경량화에 집중, 5는 말만 많은듯 [3] ㅇㅇ(106.101) 05.15 194 3
474509 일반 사실 agi 이미 가능한데 쉬쉬 할 뿐. [2] ㅇㅇ(221.140) 05.15 149 0
474508 일반 점진적으로 단순업무가 사라져갈거임 [1] ㅇㅇ(1.249) 05.15 87 0
474507 일반 역노화 같은 혁신이 생기는데 gdp 큰 변화가 없을리가 [2] ㅇㅇ(121.128) 05.15 119 0
474506 일반 일리야 오픈ai 나온지 몆달은 된거네 [2] ㅇㅇ갤로그로 이동합니다. 05.15 142 0
474505 일반 근데 니들 그거 아냐? [2] ㅇㅇ(211.235) 05.15 82 0
474504 일반 이제 갤주 얀르쿤임? [2] ㅇㅇ(121.144) 05.15 94 0
474503 일반 점진적인건 당연한거지ㅋㅋ ㅇㅇ(182.219) 05.15 55 0
474502 일반 공지사항) 특갤 로고 변경 안내 [1] ㅇㅇ(218.149) 05.15 157 1
474501 일반 lmsys에서 아직 also gpt2 나오는데 나만 그러냐 [2] ㅇㅇ­갤로그로 이동합니다. 05.15 119 0
474500 일반 일리야가 그동안 진행한 프로젝트 발표한다며 [2] ㅇㅇ갤로그로 이동합니다. 05.15 126 0
474498 일반 그래도 gpt5까지는 봐야 알 수 있을듯 ㅇㅇ(180.182) 05.15 40 0
474497 일반 근데 특붕이들아 agi가 나와야 역노화가 실현가능한거냐?? [5] ㅇㅇ(180.69) 05.15 209 0
474496 일반 갓반인들에게 이번 발표 설명해주기 좋은영상 ㅇㅇ갤로그로 이동합니다. 05.15 93 0
474495 일반 무슨 agi달성후 초지능은 몇일내로 가능할수도 잇다고 ㅇㅇ(117.20) 05.15 107 0
474494 일반 결국 현재 기술로는 로그함수라는거네ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(121.144) 05.15 76 0
474493 일반 1.5울트라 기대했는데 아쉬우면 개추 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 쿠드갤로그로 이동합니다. 05.15 53 2
474492 일반 결국 선형층의 승리 ㅇㅇ(125.242) 05.15 54 0
474491 일반 이거보면 국 내 기술은 발전이 진짜 어려울듯 ㅇㅇ(106.248) 05.15 45 0
474490 일반 그래서 거품이냐 마법이냐?? [3] ㅇㅇ(221.155) 05.15 173 0
474489 일반 개인적으로 알트만한테 진짜 스케일 업만으로 agi에 갈 수 있냐 묻고싶음 ㅇㅇ(180.182) 05.15 66 0
474488 일반 보수화된것도 기대컨도 아니라 걍 성능정체같아 ㅇㅇ(1.249) 05.15 51 0
474487 일반 오픈ai 기술격차 생각보다크지않은듯 [5] ㅇㅇ(14.53) 05.15 266 3
474485 일반 팩트는 이대로 점진적 발전이면 기후재앙으로 멸망 확정임 [1] ㅇㅇ(121.144) 05.15 87 0
474484 일반 당연히 직업들은 점진적으로 대체되겠지 [1] ㅇㅇ(59.26) 05.15 101 0
474483 일반 난 그냥 작품감상나눌수 있을정도의 수준만 기대하는중임 ㅇㅇ(1.249) 05.15 43 0
474482 일반 의사도 당연히 대체되지만 그건 중요한게 아님 ㅇㅇ(180.182) 05.15 59 0
474481 일반 몇 십년 후면 아직 살아있을 나이니깐 괜찮아 [5] ㅇㅇ(218.147) 05.15 192 1
474480 일반 gpt 4o 왜 안써짐?? [2] dd(222.237) 05.15 187 0
474478 일반 GPT4 백날 뚜드리는건 병신짓이지 ㅇㅇ갤로그로 이동합니다. 05.15 57 0
474477 일반 선형충 게이들은 설마 모든 모델을 바로바로 공개한다 생각하노? [1] ㅇㅇ(221.140) 05.15 86 0
474476 일반 니들 인 어 니들스택(Needle in a Needlestack) 근황 [8] ㅇㅇ(106.248) 05.15 150 1
474475 일반 또 불확실한 형용사 하나 가지고 일희일비하기 시작하네 ㅇㅇ갤로그로 이동합니다. 05.15 68 1
474474 일반 agi가 와도 확 변하는 건 없다고 보는 건가? [1] ㅇㅇ(121.128) 05.15 82 0
474473 일반 특이점이 왔다고 해도 인간의 모든욕망이 충족될까? [1] ㅇㅇ(1.249) 05.15 49 0
474472 일반 근데 화이트칼라 10퍼 20퍼도 엄청 큰 비율임 [1] ㅇㅇ(180.182) 05.15 77 0
474471 일반 "가속 시켜" 도대체 멀 가속시킨단 말이고? ㅇㅇ(117.20) 05.15 85 0
474469 일반 업계1위가 확정되서 보수화된거임 [1] ㅇㅇ(211.114) 05.15 93 0
474468 일반 agi를 달성했다 가정해도 그 자체로 문제임 [2] ㅇㅇ(121.186) 05.15 105 0
474467 일반 점진적이란 표현은 상대적인것이지 [2] ㅇㅇ(59.26) 05.15 91 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2