GPT에게 조언을 구하는 건 사실 나무위키를 참조햐는 것 이하라고 생각함.
(여담이지만 나무위키애서도 최근 규정이 생겨서 GPT의 발언은 근거로 못쓰게 규정함)
첫 번째로.
1. 대부분의 대형언어모델(LLM)은 긍정 편향을 가지고 있음.
이 긍정 편향은 아예 시스템적으로 고정된 거임. 즉, 사용자가 ‘원하는 방향‘에 부응하는 대답을 내놓도록 유도하는 건데, 거칠게 말하자면 ’간신배 마인드‘ 임. 니가 a라 했는데, 바로 다음에 ’훼이크다 이 병신아 b가 맞아‘ 이러면 걔는 ’네, b입니다‘ 라고 한다.
2. LLM이 학습한 게 정확한지 의문임.
LLM 제작자가 미리 떠먹였든지, 아니면 LLM이 기계학습으로 스스로 배웠던 간에, GPT는 어디선가 학습한 정보대로 대답하게 되어 있음.
아마 chatgpt 키면 팝업이나 공지 같은걸로 '얘는 몇년 몇월까지의 학습 결과에 기반합니다‘ 라고 나올 텐데, 그 기간을 넘어가는 내용을 물으면 얘도 별로 할 말 없다.
그나마 ’해당 정보는 학습되어 있지 않아 답변할 수 없습니다‘ 라고 정직하게 답을 하면 모를까, 소위 환각이라고 지가 썰을 창작해서 내놓을 수도 있다.
3. LLM의 대답은 얼마든지 조작이 가능하다.
펨코 같은데서 '한녀썰 카톡‘ 이라고 올라오는걸 못 믿는 이유는, 조작이 가능하기 때문임. 카카오톡 대화록인것처럼 조작하는 앱이 있는지는 오래되었음.
카카오톡 공식으로 대화록을 외부로 추출하는 기능은 자동으로 사용자 이름을 익명화함. 그러니까, 한녀의 처참한 능지.jpg 라고 올린 게. 사실 펨코남 둘이서 짜고 친 대화라고 해도 검증할 법이 없다.
내가 위에서 긍정 편향을 이야기했는데, 그 긍정 편향 때문에 내가 원하는 답을 유도하는게 가능하다. 위 스샷은 어처구니없고 노골적인 방향으로 짧게 만든 건데, 예를 들어 ‘무조건 이재명을 옹호/비판’ 하는 방식으로 대답하라고 선 명령을 한 뒤, 그 부분만 잘라서 올리면 ‘chatgpt가 민주당을 지지/비판한다’고 얼마든지 선동할 수 있다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.