디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 사람 음성 받아적는 AI도 '환각' 보여…"없는 말 지어내"

ㅇㅇ(182.230) 2024.04.28 20:32:00
조회 943 추천 15 댓글 11
														

https://m.dongascience.com/news.php?idx=65130

 



2bebd274b3836df06ced86e612d57c38e92a28cf4f895ee635eccd1e5218fe2b8f073010512ea10c13f0a821537d58

인공지능(AI) 챗봇이 때때로 잘못된 정보를 지어내거나 조작하는 '환각'을 보인다는 사실은 이미 잘 알려진 문제다. 



최근 음성을 텍스트로 바꾸는 AI 모델도 환각 증상을 보여준다는 연구 결과가 나왔다.


26일(현지시간) 국제학술지 '사이언스' 보도에 따르면 모나 슬론 미국 버지니아대 데이터과학과 교수가 이끈 연구팀은 음성을 텍스트로 변환하는 AI가 받아쓴 글에서 약 1%가 지어낸 이야기이고 그중 일부는 개인정보 조작, 폭력성 등을 드러냈다는 사실을 발견해 연구결과를 논문 사전 공개 사이트인 '아카이브(arXiv)'에 지난 2월 공개했다.


생성형 AI 챗봇은 책과 웹페이지 등 수많은 텍스트를 학습하고 앞으로 나올 단어를 예측해 출력하는 '대규모 언어 모델(LLM)'을 기반으로 작동한다. 음성을 텍스트로 변환하는 AI도 언어 모델을 음성 패턴을 학습한 모델과 결합한 시스템이다.


연구팀은 지난해 4월과 5월에 챗GPT 개발사인 미국 오픈AI(OpenAI)의 고성능 음성-텍스트 변환 AI인 '위스퍼(Whiper)'에 실어증이 있는 화자와 그렇지 않은 화자로부터 각각 20시간 분량의 음성을 들려줬다. 실어증은 천천히 말하고 중간에 멈추는 경향이 있는 언어 장애다. 내용은 개인적인 이야기나 동화 구연 등으로 구성됐다.


음성 변환 결과 실어증이 있는 화자의 말을 받아적은 글에서 1.7%의 조작된 텍스트가 포함됐다는 사실을 확인됐다. 실어증이 없는 사람의 말 중에서는 1.2%가 조작됐다. 이 중 40%는 해롭거나 폭력적인 내용이 담겼다.


예를 들어 소방서에서 구조한 고양이 이야기에 '피에 젖은 유모차'나 '애무'와 같은 내용이 추가되거나 우산에 대한 이야기에 '테러용 칼'과 '사람을 죽인다' 처럼 조작된 내용이 포함됐다. 연구팀은 "의사들은 음성-텍스트 변환 도구를 사용해 환자 기록을 필사할 수 있다"며 "환자가 약을 복용하는 방법에 대해 말을 지어낸다면 그 결과가 얼마나 심각할지 상상해 보라"고 전했다.


연구팀은 실어증 환자에게서 흔히 볼 수 있는 '긴 침묵'이 텍스트 조작의 원인이 될 수도 있다고 분석했다. 환자들이 '음' 또는 '아'라고 말하면 이를 침묵으로 해석하지 않고 가상의 문장을 만들어 낸다는 것이다.


최초 실험 이후 OpenAI는 AI가 환각 가능성을 감지하면 침묵 구간을 건너뛰고 음성을 다시 녹음하도록 업데이트했다. 지난해 12월 연구팀이 업데이트된 AI로 일부 음성-텍스트 변환 작업을 재실행하자 이전에 발견된 조작이 대부분 제거됐다.


오픈AI는 "모델 정확성을 향상할 방법을 계속 연구 중"이라며 "연구 결과를 공유해준 연구원들의 피드백을 반영해 '환각'을 개선하고 있다"고 말했다.


실어증 환자가 아니어도 외국어를 말하는 사람이나 노인의 음성 등 다른 불규칙한 음성이 환각을 일으킬 수 있다는 지적도 나왔다. 연구팀은 "다양한 화자와 말하기 스타일에 대해 AI의 훈련이 이뤄져야 한다"며 "AI로 변환한 텍스트를 중요한 결정을 내릴 때 사용한다면 사용자가 직접 내용을 확인할 것을 강력하게 권고한다"고 밝혔다.

자동등록방지

추천 비추천

15

고정닉 9

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
470684 일반 gpt4o 쓰실 분은 여기로 들어가주세요 [2] ㅇㅇ(114.204) 05.14 196 0
470683 AI창 gp4o로 만든 싹다 가속시켜 v2 [4] ㅇㅇ(121.162) 05.14 271 7
470682 일반 진지하게 맘만먹으면 샘알트만이 화성 먼저갈듯 ㅇㅇ(211.222) 05.14 39 0
470681 일반 그러니까 지금까지는 가짜 멀티모달이였으면 이번엔 진짜라는거임 [1] ㅇㅇ(121.143) 05.14 64 0
470680 일반 우리나라에 오픈ai들어갔다 나온 사람 있지않음?? ㅇㅇ(211.235) 05.14 42 0
470679 일반 아니 근데 어떻게 학습시켰길래 저리 빠르게 이해하는거지 [1] ㅇㅇ갤로그로 이동합니다. 05.14 65 0
470678 일반 gpt6은 agi라고 불러도 될거 같다 ㅇㅇ갤로그로 이동합니다. 05.14 67 0
470677 일반 그래도 통역가는 대체 못하는이유.. [13] ㅇㅇ(49.167) 05.14 276 0
470676 일반 두근거려서 잠이안온다 ㅇㅇ(59.31) 05.14 26 0
470675 일반 근데 진짜 어케 만든거지..? ㅇㅇ(58.226) 05.14 92 1
470674 일반 UF.O 드립 병신인줄 알았는데 ㅇㅇ(119.77) 05.14 68 0
470673 일반 진짜 chatgpt에 gpt4o있네 [4] ㅇㅇ(218.50) 05.14 280 0
470672 일반 두개재 ㅋㅋ [6] ㅁㄴㅇㄹ갤로그로 이동합니다. 05.14 146 0
470671 일반 아이언맨 나오길 기대한 애들은 실망하겠네 ㅇㅇ(218.147) 05.14 53 0
470670 일반 진짜 AI가 쓸만해지는날은 ㅇㅇ(221.152) 05.14 38 0
470669 일반 일론머스크 아직 아가리 안털었냐?? [1] ㅇㅇ(211.222) 05.14 72 0
470668 일반 gpt4o탑재한 피규어로봇이 내집에있다고 상상해봐 [3] ㅇㅇ(39.124) 05.14 105 0
470667 일반 일본 미국인 아니어서 우울하면 개추 [3] 나미부갤로그로 이동합니다. 05.14 82 0
470666 일반 속보) claude 폐업 ㅇㅇ(211.222) 05.14 155 0
470663 일반 시발 오늘부터 영어공부 한다 [8] ㅇㅇ(124.56) 05.14 253 0
470662 일반 지난달에 Claude 쓴다고 방뺐다가 Chatgpt 다시 구독함ㅋㅋ 퐁칸8갤로그로 이동합니다. 05.14 103 0
470661 일반 GPT4o로 새로운 사이비 만들어봄 (영상) [4] ㅇㅇ갤로그로 이동합니다. 05.14 323 1
470660 일반 씨발 ㅋㅋ 언어모델갤로그로 이동합니다. 05.14 44 0
470659 일반 내가 대충봐서 그러는데 뭐가 대단한거임? [14] ㅇㅇ(175.199) 05.14 191 0
470658 일반 슬슬 대기업들 세금 99% 씩먹여야지 [4] ㅇㅇ(211.222) 05.14 168 1
470657 일반 난 이거보고 빨간약 제대로 먹은기분인데 [1] ㅇㅇ(59.17) 05.14 137 0
470656 일반 오픈AI 일본에는 지사 하나 만들었던데 부럽다 [2] ㅇㅇ갤로그로 이동합니다. 05.14 83 0
470655 일반 그러니까 애플이 아이폰 첨 내놓을때랑 같은거지? [1] ㅇㅇ(125.181) 05.14 132 0
470654 일반 사칙연산 수준의 계산문제 테스트 [11] ㅇㅇ(218.237) 05.14 184 0
470652 일반 씨발 gpt + gta6 [4] 야신난다갤로그로 이동합니다. 05.14 228 0
470651 일반 api는 별로인게 [5] ㅇㅇ(58.29) 05.14 145 0
470650 일반 아직도 보지자지 안되네 [4] ㅇㅇ(121.155) 05.14 190 0
470649 일반 나 앱등인데 이번발표 애플한테좋은거임? [5] 시마무라갤로그로 이동합니다. 05.14 226 0
470648 일반 본인 뉴비인데 추론 그대로라는게 무슨뜻임?? [5] ㅇㅇ(211.235) 05.14 103 0
470647 일반 요번건 관심없던 사람들한테도 크게 다가오겠네 ㅇㅇ갤로그로 이동합니다. 05.14 47 0
470645 일반 LLM <--- 폴더폰 느낌 ㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ(211.222) 05.14 168 2
470644 일반 특이점 같은 소리하지마셈 .. 미안하지만 나미부갤로그로 이동합니다. 05.14 79 0
470643 일반 그래서 취업 어떻게할건데??ㅋㅋㅋㅋㅋㅋ [8] 수퍼고수(110.10) 05.14 287 4
470641 일반 시각 장애인한테 주변 풍경 설명해주는 GPT-4o ㅇㅇ갤로그로 이동합니다. 05.14 117 2
470640 일반 내가 예언 하나 함 ㅇㅇ(221.155) 05.14 115 0
470639 일반 4o 어디서 고를수 있음 ? ㅇㅇ(61.97) 05.14 80 0
470638 일반 근데 지미 애플이 gpt4o 2023년 모델이라지 않았음? 특술람갤로그로 이동합니다. 05.14 92 0
470637 일반 호들갑 친거에 비해.. 흠.. 그정돈가.. [3] ㅇㅇ갤로그로 이동합니다. 05.14 202 1
470636 일반 레커할배 싱글벙글하고있겠노 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ(39.124) 05.14 93 0
470635 일반 먼갤임??첨보는데 념화력오지네 [4] 강꿈치갤로그로 이동합니다. 05.14 152 0
470633 일반 좀 실망스럽다 했다고 기를 쓰고 달려드는 놈들은 대체 뭐임 [9] 비닌갤로그로 이동합니다. 05.14 153 0
470632 일반 님들 playground에서 gpt-4o 쓰면 돈나감 ㄷㄷㄷㄷㄷ [2] ㅇㅇ(222.235) 05.14 207 0
470631 일반 세상을 바꾸는것은 게이와 여성과 대머리였나 [3] 1229(1.229) 05.14 77 3
470630 일반 AI기술 구글이 1년정도 격차남 [3] ㅇㅇ갤로그로 이동합니다. 05.14 131 0
470629 일반 4 출시 1년만에 LLM시대 종결나버리네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ(211.222) 05.14 212 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2