디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 사람 음성 받아적는 AI도 '환각' 보여…"없는 말 지어내"

ㅇㅇ(182.230) 2024.04.28 20:32:00
조회 926 추천 15 댓글 11
														

https://m.dongascience.com/news.php?idx=65130

 



2bebd274b3836df06ced86e612d57c38e92a28cf4f895ee635eccd1e5218fe2b8f073010512ea10c13f0a821537d58

인공지능(AI) 챗봇이 때때로 잘못된 정보를 지어내거나 조작하는 '환각'을 보인다는 사실은 이미 잘 알려진 문제다. 



최근 음성을 텍스트로 바꾸는 AI 모델도 환각 증상을 보여준다는 연구 결과가 나왔다.


26일(현지시간) 국제학술지 '사이언스' 보도에 따르면 모나 슬론 미국 버지니아대 데이터과학과 교수가 이끈 연구팀은 음성을 텍스트로 변환하는 AI가 받아쓴 글에서 약 1%가 지어낸 이야기이고 그중 일부는 개인정보 조작, 폭력성 등을 드러냈다는 사실을 발견해 연구결과를 논문 사전 공개 사이트인 '아카이브(arXiv)'에 지난 2월 공개했다.


생성형 AI 챗봇은 책과 웹페이지 등 수많은 텍스트를 학습하고 앞으로 나올 단어를 예측해 출력하는 '대규모 언어 모델(LLM)'을 기반으로 작동한다. 음성을 텍스트로 변환하는 AI도 언어 모델을 음성 패턴을 학습한 모델과 결합한 시스템이다.


연구팀은 지난해 4월과 5월에 챗GPT 개발사인 미국 오픈AI(OpenAI)의 고성능 음성-텍스트 변환 AI인 '위스퍼(Whiper)'에 실어증이 있는 화자와 그렇지 않은 화자로부터 각각 20시간 분량의 음성을 들려줬다. 실어증은 천천히 말하고 중간에 멈추는 경향이 있는 언어 장애다. 내용은 개인적인 이야기나 동화 구연 등으로 구성됐다.


음성 변환 결과 실어증이 있는 화자의 말을 받아적은 글에서 1.7%의 조작된 텍스트가 포함됐다는 사실을 확인됐다. 실어증이 없는 사람의 말 중에서는 1.2%가 조작됐다. 이 중 40%는 해롭거나 폭력적인 내용이 담겼다.


예를 들어 소방서에서 구조한 고양이 이야기에 '피에 젖은 유모차'나 '애무'와 같은 내용이 추가되거나 우산에 대한 이야기에 '테러용 칼'과 '사람을 죽인다' 처럼 조작된 내용이 포함됐다. 연구팀은 "의사들은 음성-텍스트 변환 도구를 사용해 환자 기록을 필사할 수 있다"며 "환자가 약을 복용하는 방법에 대해 말을 지어낸다면 그 결과가 얼마나 심각할지 상상해 보라"고 전했다.


연구팀은 실어증 환자에게서 흔히 볼 수 있는 '긴 침묵'이 텍스트 조작의 원인이 될 수도 있다고 분석했다. 환자들이 '음' 또는 '아'라고 말하면 이를 침묵으로 해석하지 않고 가상의 문장을 만들어 낸다는 것이다.


최초 실험 이후 OpenAI는 AI가 환각 가능성을 감지하면 침묵 구간을 건너뛰고 음성을 다시 녹음하도록 업데이트했다. 지난해 12월 연구팀이 업데이트된 AI로 일부 음성-텍스트 변환 작업을 재실행하자 이전에 발견된 조작이 대부분 제거됐다.


오픈AI는 "모델 정확성을 향상할 방법을 계속 연구 중"이라며 "연구 결과를 공유해준 연구원들의 피드백을 반영해 '환각'을 개선하고 있다"고 말했다.


실어증 환자가 아니어도 외국어를 말하는 사람이나 노인의 음성 등 다른 불규칙한 음성이 환각을 일으킬 수 있다는 지적도 나왔다. 연구팀은 "다양한 화자와 말하기 스타일에 대해 AI의 훈련이 이뤄져야 한다"며 "AI로 변환한 텍스트를 중요한 결정을 내릴 때 사용한다면 사용자가 직접 내용을 확인할 것을 강력하게 권고한다"고 밝혔다.

자동등록방지

추천 비추천

15

고정닉 9

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2860 설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
475791 일반 여기 글볼때마다 일때려치고싶다 [4] ㅇㅇ(115.94) 05.16 145 0
475790 일반 ai에 대해 알면 알수록 괘씸한 새끼 [2] ㅇㅇ(211.184) 05.16 168 2
475788 일반 인체실험은 무엇보다 가성비가 안맞아서 잘 안한다 [2] ㅇㅇ(121.144) 05.16 73 0
475786 일반 인체실험도 활발히 하면 좋겠다 [7] 갤럭시빠갤로그로 이동합니다. 05.16 141 0
475785 일반 알트만이 알고보니 수직충이었네 [2] et갤로그로 이동합니다. 05.16 193 0
475784 일반 그러고보니 구글 비디오 생성 ai 예전에도 있었지 않나 [1] ㅇㅇ갤로그로 이동합니다. 05.16 69 0
475783 AI창 거의 다 그린 배경스케치 마무리만 AI한테 맡기기 [9] ㅇㅇ(211.109) 05.16 378 7
475782 일반 제미니프로 2달 무료네 [3] ㅇㅇ(222.101) 05.16 195 0
475781 일반 그림그리면서 설명해주는 기능은 안만들어주나 ㅇㅇ갤로그로 이동합니다. 05.16 69 0
475780 일반 다운로드까진 안 바라고 학습 증강 같은건 없나 ㅇㅇ갤로그로 이동합니다. 05.16 37 0
475779 일반 뇌에 칩 박아서 지능 높히는거 언제 나옴? [4] ㅇㅇ갤로그로 이동합니다. 05.16 145 0
475778 일반 GPT-4o 신기능 connected Apps 출시 유출 [6] ㅇㅇ(1.221) 05.16 481 2
475777 일반 내가 지금까지 쓰던게 4o라고? [4] 주승이갤로그로 이동합니다. 05.16 289 0
475776 일반 확실히 ai버블은 '버블'이 아니다. [1] 친근한게이브갤로그로 이동합니다. 05.16 172 0
475775 일반 GPT4o 플러그인 질문 [1] ㅇㅇ(211.193) 05.16 89 0
475774 일반 오픈ai 연구원 퇴사후에 새로운 스타트업 설립하네 [4] ㅇㅇ갤로그로 이동합니다. 05.16 338 0
475773 일반 근데 설레발에 비해 4o도 프로그래밍 너무 어려운데? [9] ㅇㅇ(122.43) 05.16 282 0
475772 일반 근데 반말 은근 꼴리네 [6] ㅇㅇ(118.235) 05.16 263 3
475771 일반 조화환원객관이론 관련 뉴스 떴어. [10] ㅇㅇ갤로그로 이동합니다. 05.16 328 2
475770 일반 진짜 그림 틀만 대충그리고 보정 가능하네 [3] 친근한게이브갤로그로 이동합니다. 05.16 204 0
475768 AI창 내가 힘들게 그린 그림 AI한테 마무리만 부탁하기 [8] ㅇㅇ(211.109) 05.16 321 3
475767 일반 아이폰 독점은 맞는데 윈도os도 독점하겠지 [1] ㅇㅇ(121.131) 05.16 144 0
475766 일반 니네 엊그제까지만 해도 우울증아니었냐 [1] ㅇㅇ(211.228) 05.16 109 0
475765 일반 Gpt4o무료가 gpt5염두해두고 만든거같은데 [2] 친근한게이브갤로그로 이동합니다. 05.16 265 1
475764 정보 플라톤적 표현 가설 [23] 특술람갤로그로 이동합니다. 05.16 479 10
475762 일반 챗gpt로 보고서 같은 글써가지고 과제 제출하면 알아낼 수 있나? [3] 세태야합갤로그로 이동합니다. 05.16 119 0
475760 일반 agi랑 재귀개선은 다른얘기 아님? [7] ㅇㅇ(211.254) 05.16 153 0
475759 일반 저번에 뭐 보니까 [1] ㅇㅇ갤로그로 이동합니다. 05.16 66 0
475758 일반 오픈ai가 모든 시장 장악할 가능성은 없나? [11] ㅇㅇ(117.20) 05.16 263 0
475757 일반 oai 공동창업자"1~2년안으로 ai가 전체 코딩 프로젝트 수행할것" [5] ㅇㅇ갤로그로 이동합니다. 05.16 399 3
475756 일반 근데 니네 세상이 니네한테 끼워맞춰져있다고 느껴본적있냐 [22] ㅇㅇ(14.53) 05.16 333 2
475754 일반 2025작은 특이점<<<진짜였을지도 [3] ㅇㅇ(121.131) 05.16 311 0
475753 일반 난 요즘 챗봇한테 나쁜말 안함 [8] ㅇㅇ(112.165) 05.16 214 0
475752 일반 4o 이 새끼 내가 반말까면 무조건 반말로 대답하네 [2] ㅇㅇ(118.235) 05.16 127 0
475751 일반 쓸모는 없는데......... gpt로 웹사이트 한 번 만들어봤어 [6] ㅇㅇ(121.159) 05.16 272 3
475750 일반 전독시 AI로 게임처럼 하니까 ㅈㄴ 재밌노 ㅋㅋㅋ [21] ㅇㅇ갤로그로 이동합니다. 05.16 2238 27
475749 일반 엔비디아 회장이 왜 이런말 한지 이제 알겠음 [3] 섹보갤로그로 이동합니다. 05.16 379 1
475748 일반 다니엘 코코타일로 agi 올해에서 29년으로 예측 [9] ㅇㅇ갤로그로 이동합니다. 05.16 294 1
475747 일반 Gpt5되면 유비쿼터슨지 뭔지 슬슬 될듯 ㅇㅇ(121.131) 05.16 80 0
475746 일반 오픈AI 최고 수준 인력 대체까지 5년? ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ갤로그로 이동합니다. 05.16 368 1
475745 일반 알트만이 씨부린것보다 머스크타임이 더 정확함 [3] ㅇㅇ(121.144) 05.16 176 0
475744 일반 베터리쪽 분야는 생각보다 오래걸릴 것 같음 ㅇㅇ(121.159) 05.16 65 0
475743 일반 agi 2029론은 알트만이 아니라 머스크였구나 [11] ㅇㅇ(211.184) 05.16 248 0
475742 일반 꿀벌도 사칙연산이 가능한데 [5] ㅇㅇ(121.159) 05.16 150 0
475741 일반 념글 요약하면 이건가? [2] ㅁㄱㅌㅊ(14.47) 05.16 231 0
475739 일반 금속에 동전 떨어지는 소리 정확한 거 같은데 [1] ㅇㅇ갤로그로 이동합니다. 05.16 183 0
475737 일반 지금 성능 꼬라지보니까 2030년엔 작살나겠다 [5] ㅇㅇ(117.20) 05.16 407 0
475736 AI창 내 그림을 보정하고 사람으로 만들기 [7] ㅇㅇ(211.109) 05.16 330 0
475735 AI창 거의 다 그린 그림 AI가 마지막 보정만 살짝 해줌 [48] ㅇㅇ(211.109) 05.16 4941 47
475734 일반 코딩은 보니까 데이터 많은 건 잘하고 없는 건 개못하네 [6] ㅇㅇ(112.152) 05.16 248 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2