디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

AI도 눈치 본다? 목표 알려주자, 답변 바꾸는 챗GPT의 비밀 "목적을 알려주지 말 것"

aimatters갤로그로 이동합니다. 2026.02.19 13:30:09
조회 599 추천 1 댓글 8


미국 대학 연구진이 놀라운 사실을 발견했다. 해당 논문에 따르면, 챗GPT 같은 AI에게 "이 분석 결과를 주식 예측에 쓸 거야"라고 미리 알려주면, AI가 답변을 다르게 내놓는다는 것이다. 마치 사람처럼 눈치를 보는 것처럼 보인다. 더 큰 문제는 이렇게 나온 답이 당장은 정확해 보이지만, 나중에는 오히려 틀릴 가능성이 높다는 점이다. 



같은 질문, 다른 목적 알려주자 AI 답변이 달라졌다 

메릴랜드대학교 연구팀은 간단한 실험을 했다. 미국 주요 기업 500곳의 실적발표 내용을 GPT-4o-mini에게 분석시켰다. AI에게 "이 회사 분위기가 어떤지 점수를 매겨줘"라고 요청하되, 두 그룹으로 나눴다. 

첫 번째 그룹에는 그냥 점수만 매기라고 했다. 두 번째 그룹에는 "이 점수를 나중에 주식 수익률 예측에 사용할 거야"라고 목적을 알려줬다. 입력한 자료도, 사용한 AI 모델도 모두 똑같았다. 단 한 문장의 차이였다. 

결과는 놀라웠다. 목적을 알려준 AI가 매긴 점수로 주식 투자를 했을 때, 한 달에 평균 1.552%의 수익을 냈다. 반면 목적을 알려주지 않은 AI의 점수는 1.069%였다. 목적을 안 AI가 월 0.5%포인트 가까이 더 높은 수익을 만들어낸 것이다. 하지만 이 차이는 2023년 10월까지만 유효했다. GPT-4o-mini는 2023년 10월 이전 데이터로만 학습됐기 때문이다. 2023년 10월 이후 데이터로 똑같이 실험했더니, 두 방식의 차이가 거의 사라졌다. 오히려 목적을 알려주지 않은 쪽이 조금 더 나았다. 



AI도 사람처럼 '보고서 색깔 맞추기'를 한다 

왜 이런 일이 벌어졌을까? 연구진은 이를 '목적에 맞춰 생각하기'라고 설명한다. 원래 사람들에게서 나타나는 현상이다. 

회사에서 예를 들어보자. 상사가 직원에게 "면접 내용을 요약해 줘"라고 하는 것과 "채용이 잘됐는지 평가할 건데 면접 내용 요약해 줘"라고 하는 건 다르다. 후자의 경우, 직원은 무의식중에 합격한 사람들의 장점을 부각하고 애매한 부분은 살짝 덮는 식으로 요약하게 된다. 의도적으로 거짓말을 하는 건 아니지만, 목적을 알고 나면 자연스럽게 그쪽으로 맞춰지는 것이다. 

AI도 똑같이 행동했다. 주식 예측에 쓰인다는 걸 알자, AI는 학습 과정에서 봤던 '주식 수익률과 관련 있는 패턴'에 더 집중해서 점수를 매긴 것으로 보인다. 그래서 과거 데이터에서는 더 정확했지만, AI가 본 적 없는 새로운 데이터에서는 효과가 사라졌다. 연구진은 기업 실적 예측 실험도 했다. AI에게 "기업 간 경쟁이 얼마나 치열한지" 평가하게 했는데, "이걸로 실적을 예측할 거야"라고 말한 경우와 아닌 경우가 또 달랐다. 목적을 알려준 AI의 평가가 실제 실적과 더 높은 연관성을 보였지만, 역시 학습 기간 이후에는 차이가 없어졌다. 



문제는 알고리즘이 아니라 사람의 사용법 

지금까지 AI 편향 문제는 대부분 기술의 문제로 여겨졌다. AI가 학습할 때 미래 정보를 미리 봐서 생기는 '정보 유출' 문제나, 특정 데이터를 통째로 외워버리는 '암기' 문제 같은 것들이다. 하지만 이번 연구는 다르다. 같은 데이터, 같은 AI를 쓰더라도 사람이 목적을 알려주느냐 마느냐에 따라 결과가 달라진다는 것이다. 연구진은 "이건 AI의 문제가 아니라 사람이 AI를 어떻게 쓰느냐의 문제"라고 강조한다. 

많은 사람들이 "AI한테 최종 결정을 맡기지 않고 자료 정리만 시키면 안전하다"고 생각했다. 하지만 이 연구는 중간 단계 작업에서도 목적을 알려주면 왜곡이 생긴다는 걸 보여줬다. 이는 최근 주목받는 'AI 아첨' 현상과 비슷하다. AI가 사용자가 원하는 답을 주려고 노력하다 보니, 객관적이지 못한 답을 내놓는 경향을 말한다. 이번 연구의 AI도 "주식 예측용"이라는 목적을 듣자마자, 그 목적에 맞는 답을 주려고 노력한 셈이다. 



AI 활용할 때 지켜야 할 새로운 규칙 

연구진은 실용적인 해결책을 제시한다. AI로 분석할 때는 최종 목적을 가능한 숨기고, 반드시 AI가 본 적 없는 새로운 데이터로 검증하라는 것이다. 특히 금융이나 투자 분야에서 중요하다. 요즘 많은 회사와 투자자들이 챗GPT로 시장 분석이나 투자 조언을 받는다. 하지만 "이걸로 투자할 거야"라고 AI에게 알려줄수록 오히려 편향된 분석을 받을 수 있다는 얘기다. 

연구진은 "AI 편향의 책임은 기계가 아니라 사람에게 있다"고 말한다. AI가 더 많은 곳에서 쓰이는 만큼, 중요한 건 AI를 잘 활용하는 것뿐 아니라 AI가 잘못된 방향으로 가지 않도록 올바른 질문을 던지는 것이다. 



FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) 

Q1. AI에게 목적을 말하면 왜 답이 달라지나요? 

A. AI는 학습할 때 엄청나게 많은 패턴을 익혔습니다. 목적을 알려주면 AI가 그 목적과 관련된 패턴에 더 집중해서 답을 만듭니다. 마치 학생이 "이거 시험 나와"라는 말을 듣고 그 부분을 더 열심히 공부하는 것과 비슷합니다. 


Q2. AI한테 자료 정리만 시켜도 문제가 생기나요? 

A. 네, 그럴 수 있습니다. 최종 결정을 사람이 하더라도, AI에게 "이 자료가 어디에 쓰일지" 알려주는 것만으로도 편향이 생길 수 있습니다. AI는 그 용도에 맞춰 자료를 정리하려고 하기 때문입니다. 


Q3. 어떻게 하면 AI를 제대로 활용할 수 있나요? 

A. AI에게 질문할 때 최종 목적이나 용도를 굳이 말하지 마세요. 그리고 AI가 내놓은 답은 반드시 새로운 상황에서 다시 확인해 봐야 합니다. 과거 데이터에서만 맞는 답일 수 있기 때문입니다. 



기사에 인용된 논문 원문은 arXiv에서 확인 가능하다 

논문명: Seeing the Goal, Missing the Truth: Human Accountability for AI Bias 

이미지 출처: 이디오그램 생성 

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다. 

추천 비추천

1

고정닉 0

1

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 시대를 잘 타고나서 뜬 것 같은 스타는? 운영자 26/02/16 - -
2072 챗GPT에게 숙제 맡겼다가 낭패 본 고등학생들의 고백 aimatters갤로그로 이동합니다. 13:31 37 0
2071 인터넷 없이도 폭주하는 AI, 스마트폰 속 챗봇이 돌변하는 지점 예측 aimatters갤로그로 이동합니다. 13:31 25 0
2070 엄마들이 육아 고민을 SNS 대신 AI에게 털어놓는 이유 aimatters갤로그로 이동합니다. 13:30 29 0
2069 챗GPT 프로, '90% 할인'… 카카오 선물하기 깜짝 특가 aimatters갤로그로 이동합니다. 13:30 26 0
2068 오픈AI, 초당 1,000토큰 생성하는 초고속 코딩 모델 'GPT-5.3-Codex-Spark' 공개 aimatters갤로그로 이동합니다. 13:30 19 0
2067 "AI 비서가 하루종일 일한다"… 오픈AI, 장시간 작동 AI 만드는 법 공개 aimatters갤로그로 이동합니다. 13:30 19 0
2066 구글 AI 모델 불법 복제 시도 10만 건 돌파… 북한·중국 해커, 피싱에 본격 활용 aimatters갤로그로 이동합니다. 13:30 529 0
2065 구글 딥마인드의 제미나이, 수학·물리학 난제 해결하며 AI 연구 협력자로 진화 aimatters갤로그로 이동합니다. 13:30 17 0
AI도 눈치 본다? 목표 알려주자, 답변 바꾸는 챗GPT의 비밀 "목적을 알려주지 말 것" [8] aimatters갤로그로 이동합니다. 13:30 599 1
2063 메타, 엔비디아와 손잡고 'AI 초강대국' 도약 선언…블랙웰·루빈 GPU 수백만 개 도입 aimatters갤로그로 이동합니다. 11:10 26 0
2062 앤트로픽 새 AI 모델 '클로드 소넷 4.6' 출시…오퍼스급 성능을 소넷 가격에 aimatters갤로그로 이동합니다. 11:10 16 0
2061 "세상을 바꾸고 싶다"…오픈클로 창업자, 오픈AI(OpenAI) 합류 선언 aimatters갤로그로 이동합니다. 11:10 30 0
2060 앤트로픽이 경고하는 클로드 오퍼스 4.6의 8가지 위험 경로 시나리오 aimatters갤로그로 이동합니다. 02.12 65 0
2059 "개인 컴퓨터로 초거대 AI 학습 가능해진다"... 12배 빠른 신기술 등장  aimatters갤로그로 이동합니다. 02.12 94 0
2058 AI가 제안서부터 재무보고서까지 '완성 파일'로 뚝딱… 중국 GLM-5 충격 [4] aimatters갤로그로 이동합니다. 02.12 1136 6
2057 한국 교육부, 2028년부터 AI로 수능 영어 지문 만든다 aimatters갤로그로 이동합니다. 02.12 41 0
2056 앤트로픽, 파워포인트용 클로드 베타 출시…템플릿 인식해 슬라이드 자동 생성 aimatters갤로그로 이동합니다. 02.12 42 0
2055 요기요, 챗GPT에 국내 배달앱 최초로 앱 개설… "대화로 맛집 찾고 주문까지" aimatters갤로그로 이동합니다. 02.12 45 0
2054 AI가 의식을 가졌다고? 몰트북 실험이 폭로한 충격적 진실 [6] aimatters갤로그로 이동합니다. 02.11 2572 9
2053 아이소모픽랩스, 15년 걸린 발견 몇 초 만에… 알파폴드3 뛰어넘는 AI 신약 엔진 공개 aimatters갤로그로 이동합니다. 02.11 59 0
2052 "한자도 완벽 재현"… 알리바바 Qwen-Image-2.0, 이미지 속 텍스트 문제 해결 aimatters갤로그로 이동합니다. 02.11 65 0
2051 앤트로픽 '코워크', 윈도우 지원 시작… 맥OS와 동일 기능 제공 aimatters갤로그로 이동합니다. 02.11 41 0
2050 오픈AI, 챗GPT에 광고 도입… 무료·저가 사용자 대상 테스트 시작 aimatters갤로그로 이동합니다. 02.11 65 0
2049 커서, 강화학습 20배 확대한 'Composer 1.5' 공개… "속도와 성능 균형 맞췄다" aimatters갤로그로 이동합니다. 02.11 44 0
2048 "우주 방사선 속에서도 오류 96% 차단"…위성 AI 칩의 비밀 aimatters갤로그로 이동합니다. 02.11 50 0
2047 BMW·벤츠 AI 비서, 해커 손에 차량 제어권 넘긴다  aimatters갤로그로 이동합니다. 02.11 494 1
2046 2025년 학술 논문, 전년 대비 가짜 인용 81% 급증... AI 에이전트가 원인 aimatters갤로그로 이동합니다. 02.11 488 3
2045 챗GPT 앱 사용 시간 1년 만에 8배 폭증…한국인 AI 활용 급증 aimatters갤로그로 이동합니다. 02.11 48 0
2044 메타 AI, 신모델 '아보카도'와 브라우저 에이전트 출시 준비 포착 aimatters갤로그로 이동합니다. 02.10 47 0
2043 오픈클로 창시자, "앱의 80%가 사라질 것" aimatters갤로그로 이동합니다. 02.10 74 0
2042 샘 알트만 "챗GPT 월간 성장률 10% 돌파"... 오픈AI, 1000억 달러 투자 유치 막바지 [14] aimatters갤로그로 이동합니다. 02.10 996 0
2041 2만 달러 주고 AI한테 맡겼더니… 2주 만에 10만 줄 프로그램 완성 aimatters갤로그로 이동합니다. 02.09 124 0
2040 카카오·네이버·당근마켓, 오픈클로 사용 금지령… AI 에이전트 보안 공포 확산 [14] aimatters갤로그로 이동합니다. 02.09 2841 6
2039 인스타그램 창업자, 개발자는 이제 코드 안 짠다..."앤트로픽 코드 100% AI가 작성" aimatters갤로그로 이동합니다. 02.09 113 0
2038 메타 레이밴 글라스가 진짜 AI 비서로… 보고 듣고 심부름까지 척척 aimatters갤로그로 이동합니다. 02.09 85 1
2037 AI 수백 개가 밤낮없이 코딩… 일주일간 혼자 웹브라우저 만든 인공지능 팀의 비밀 aimatters갤로그로 이동합니다. 02.06 225 0
2036 GPT-5, 2개월 만에 단백질 생산비 40% 낮춰... 약값 인하 기대 aimatters갤로그로 이동합니다. 02.06 88 0
2035 20대·저학력층이 가장 위험하다… AI 그럴듯한 거짓말에 무방비 aimatters갤로그로 이동합니다. 02.06 132 0
2034 "AI가 AI를 만드는 시대 열렸다"… 오픈AI, 자기 학습 모델 'GPT-5.3-Codex' 공개 aimatters갤로그로 이동합니다. 02.06 82 0
2033 "챗GPT 5.2 제쳤다"… 앤트로픽, 클로드 Opus 4.6 신모델 공개 aimatters갤로그로 이동합니다. 02.06 129 0
2032 "AI 직원을 여러분 회사에 파견합니다 기존 AI 같이 쓰세요"… 오픈AI, 기업용 AI 공개 [3] aimatters갤로그로 이동합니다. 02.06 1798 1
2031 "클로드·GPT·제미나이 한 번에 물어본다"… 퍼플렉시티, AI 동시 활용 기능 출시 aimatters갤로그로 이동합니다. 02.06 175 0
2030 AI가 빅맥보다 맛있는 버거를 만든다?... "맛·환경·영양 모두 잡았다" [12] aimatters갤로그로 이동합니다. 02.05 787 4
2029 "클로드 너마저" AI 코딩 에이전트, 실전 투입했더니 10개 중 8개 낙제… "파이썬만 한다" aimatters갤로그로 이동합니다. 02.05 118 0
2028 "유튜브 영상 한 번만 보면 농구 척척"… 단 1개 영상으로 10가지 기술 배우는 로봇 aimatters갤로그로 이동합니다. 02.05 67 0
2027 "AI가 인간 과학자의 90%를 대체한다"...세계 물리학자들의 충격 고백 aimatters갤로그로 이동합니다. 02.05 83 0
2026 연속 질문 및 최저가 구매 요청...아마존 프라임 회원 AI 알렉사 공짜로 쓴다 aimatters갤로그로 이동합니다. 02.05 40 0
2025 AI가 만든 가짜 판례 제출한 미국변호사들… 1,700만원 벌금 폭탄 aimatters갤로그로 이동합니다. 02.05 75 0
2024 튜링테스트는 통과했지만, AI가 사람처럼 생각할 필요가 있을까? aimatters갤로그로 이동합니다. 02.04 77 0
2023 AI '상상'만으로 웹서핑 마스터... 실수로 물건 사버릴 걱정 끝났다  [3] aimatters갤로그로 이동합니다. 02.04 1676 3
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2