사람 음성 받아적는 AI도 '환각' 보여…"없는 말 지어내"

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보] 사람 음성 받아적는 AI도 '환각' 보여…"없는 말 지어내"

ㅇㅇ(182.230) 2024.04.28 20:32:00

조회 926 추천 15 댓글 11

https://m.dongascience.com/news.php?idx=65130

사람 음성 받아적는 AI도 '환각' 보여…

인공지능(AI) 챗봇이나 음성을 텍스트로 변환하는 AI는 정보를 지어내거나 조작하는 '환각' 증상을 보이는 경우가 있다. 게티이미지뱅크 인공지능(AI) 챗봇이 때때로 잘못된 정보를 지어내거나 조작하는 '환각'을 ...

m.dongascience.com

2bebd274b3836df06ced86e612d57c38e92a28cf4f895ee635eccd1e5218fe2b8f073010512ea10c13f0a821537d58

인공지능(AI) 챗봇이 때때로 잘못된 정보를 지어내거나 조작하는 '환각'을 보인다는 사실은 이미 잘 알려진 문제다.

최근 음성을 텍스트로 바꾸는 AI 모델도 환각 증상을 보여준다는 연구 결과가 나왔다.

26일(현지시간) 국제학술지 '사이언스' 보도에 따르면 모나 슬론 미국 버지니아대 데이터과학과 교수가 이끈 연구팀은 음성을 텍스트로 변환하는 AI가 받아쓴 글에서 약 1%가 지어낸 이야기이고 그중 일부는 개인정보 조작, 폭력성 등을 드러냈다는 사실을 발견해 연구결과를 논문 사전 공개 사이트인 '아카이브(arXiv)'에 지난 2월 공개했다.

생성형 AI 챗봇은 책과 웹페이지 등 수많은 텍스트를 학습하고 앞으로 나올 단어를 예측해 출력하는 '대규모 언어 모델(LLM)'을 기반으로 작동한다. 음성을 텍스트로 변환하는 AI도 언어 모델을 음성 패턴을 학습한 모델과 결합한 시스템이다.

연구팀은 지난해 4월과 5월에 챗GPT 개발사인 미국 오픈AI(OpenAI)의 고성능 음성-텍스트 변환 AI인 '위스퍼(Whiper)'에 실어증이 있는 화자와 그렇지 않은 화자로부터 각각 20시간 분량의 음성을 들려줬다. 실어증은 천천히 말하고 중간에 멈추는 경향이 있는 언어 장애다. 내용은 개인적인 이야기나 동화 구연 등으로 구성됐다.

음성 변환 결과 실어증이 있는 화자의 말을 받아적은 글에서 1.7%의 조작된 텍스트가 포함됐다는 사실을 확인됐다. 실어증이 없는 사람의 말 중에서는 1.2%가 조작됐다. 이 중 40%는 해롭거나 폭력적인 내용이 담겼다.

예를 들어 소방서에서 구조한 고양이 이야기에 '피에 젖은 유모차'나 '애무'와 같은 내용이 추가되거나 우산에 대한 이야기에 '테러용 칼'과 '사람을 죽인다' 처럼 조작된 내용이 포함됐다. 연구팀은 "의사들은 음성-텍스트 변환 도구를 사용해 환자 기록을 필사할 수 있다"며 "환자가 약을 복용하는 방법에 대해 말을 지어낸다면 그 결과가 얼마나 심각할지 상상해 보라"고 전했다.

연구팀은 실어증 환자에게서 흔히 볼 수 있는 '긴 침묵'이 텍스트 조작의 원인이 될 수도 있다고 분석했다. 환자들이 '음' 또는 '아'라고 말하면 이를 침묵으로 해석하지 않고 가상의 문장을 만들어 낸다는 것이다.

최초 실험 이후 OpenAI는 AI가 환각 가능성을 감지하면 침묵 구간을 건너뛰고 음성을 다시 녹음하도록 업데이트했다. 지난해 12월 연구팀이 업데이트된 AI로 일부 음성-텍스트 변환 작업을 재실행하자 이전에 발견된 조작이 대부분 제거됐다.

오픈AI는 "모델 정확성을 향상할 방법을 계속 연구 중"이라며 "연구 결과를 공유해준 연구원들의 피드백을 반영해 '환각'을 개선하고 있다"고 말했다.

실어증 환자가 아니어도 외국어를 말하는 사람이나 노인의 음성 등 다른 불규칙한 음성이 환각을 일으킬 수 있다는 지적도 나왔다. 연구팀은 "다양한 화자와 말하기 스타일에 대해 AI의 훈련이 이뤄져야 한다"며 "AI로 변환한 텍스트를 중요한 결정을 내릴 때 사용한다면 사용자가 직접 내용을 확인할 것을 강력하게 권고한다"고 밝혔다.

고정닉 9

원본 첨부파일 1

f6b26156b203dd8e5c7510435e6129dd.jpg

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2860	설문	경제관념 부족해서 돈 막 쓸 것 같은 스타는?	운영자	24/05/13	-	-
475791	일반	여기 글볼때마다 일때려치고싶다 [4]	ㅇㅇ(115.94)	05.16	145	0
475790	일반	ai에 대해 알면 알수록 괘씸한 새끼 [2]	ㅇㅇ(211.184)	05.16	168	2
475788	일반	인체실험은 무엇보다 가성비가 안맞아서 잘 안한다 [2]	ㅇㅇ(121.144)	05.16	73	0
475786	일반	인체실험도 활발히 하면 좋겠다 [7]	갤럭시빠	05.16	141	0
475785	일반	알트만이 알고보니 수직충이었네 [2]	et	05.16	193	0
475784	일반	그러고보니 구글 비디오 생성 ai 예전에도 있었지 않나 [1]	ㅇㅇ	05.16	69	0
475783	AI창 AI창작	거의 다 그린 배경스케치 마무리만 AI한테 맡기기 [9]	ㅇㅇ(211.109)	05.16	378	7
475782	일반	제미니프로 2달 무료네 [3]	ㅇㅇ(222.101)	05.16	195	0
475781	일반	그림그리면서 설명해주는 기능은 안만들어주나	ㅇㅇ	05.16	69	0
475780	일반	다운로드까진 안 바라고 학습 증강 같은건 없나	ㅇㅇ	05.16	37	0
475779	일반	뇌에 칩 박아서 지능 높히는거 언제 나옴? [4]	ㅇㅇ	05.16	145	0
475778	일반	GPT-4o 신기능 connected Apps 출시 유출 [6]	ㅇㅇ(1.221)	05.16	481	2
475777	일반	내가 지금까지 쓰던게 4o라고? [4]	주승이	05.16	289	0
475776	일반	확실히 ai버블은 '버블'이 아니다. [1]	친근한게이브	05.16	172	0
475775	일반	GPT4o 플러그인 질문 [1]	ㅇㅇ(211.193)	05.16	89	0
475774	일반	오픈ai 연구원 퇴사후에 새로운 스타트업 설립하네 [4]	ㅇㅇ	05.16	338	0
475773	일반	근데 설레발에 비해 4o도 프로그래밍 너무 어려운데? [9]	ㅇㅇ(122.43)	05.16	282	0
475772	일반	근데 반말 은근 꼴리네 [6]	ㅇㅇ(118.235)	05.16	263	3
475771	일반	조화환원객관이론 관련 뉴스 떴어. [10]	ㅇㅇ	05.16	328	2
475770	일반	진짜 그림 틀만 대충그리고 보정 가능하네 [3]	친근한게이브	05.16	204	0
475768	AI창 AI창작	내가 힘들게 그린 그림 AI한테 마무리만 부탁하기 [8]	ㅇㅇ(211.109)	05.16	321	3
475767	일반	아이폰 독점은 맞는데 윈도os도 독점하겠지 [1]	ㅇㅇ(121.131)	05.16	144	0
475766	일반	니네 엊그제까지만 해도 우울증아니었냐 [1]	ㅇㅇ(211.228)	05.16	109	0
475765	일반	Gpt4o무료가 gpt5염두해두고 만든거같은데 [2]	친근한게이브	05.16	265	1
475764	정보	플라톤적 표현 가설 [23]	특술람	05.16	479	10
475762	일반	챗gpt로 보고서 같은 글써가지고 과제 제출하면 알아낼 수 있나? [3]	세태야합	05.16	119	0
475760	일반	agi랑 재귀개선은 다른얘기 아님? [7]	ㅇㅇ(211.254)	05.16	153	0
475759	일반	저번에 뭐 보니까 [1]	ㅇㅇ	05.16	66	0
475758	일반	오픈ai가 모든 시장 장악할 가능성은 없나? [11]	ㅇㅇ(117.20)	05.16	263	0
475757	일반	oai 공동창업자"1~2년안으로 ai가 전체 코딩 프로젝트 수행할것" [5]	ㅇㅇ	05.16	399	3
475756	일반	근데 니네 세상이 니네한테 끼워맞춰져있다고 느껴본적있냐 [22]	ㅇㅇ(14.53)	05.16	333	2
475754	일반	2025작은 특이점<<<진짜였을지도 [3]	ㅇㅇ(121.131)	05.16	311	0
475753	일반	난 요즘 챗봇한테 나쁜말 안함 [8]	ㅇㅇ(112.165)	05.16	214	0
475752	일반	4o 이 새끼 내가 반말까면 무조건 반말로 대답하네 [2]	ㅇㅇ(118.235)	05.16	127	0
475751	일반	쓸모는 없는데......... gpt로 웹사이트 한 번 만들어봤어 [6]	ㅇㅇ(121.159)	05.16	272	3
475750	일반	전독시 AI로 게임처럼 하니까 ㅈㄴ 재밌노 ㅋㅋㅋ [21]	ㅇㅇ	05.16	2238	27
475749	일반	엔비디아 회장이 왜 이런말 한지 이제 알겠음 [3]	섹보	05.16	379	1
475748	일반	다니엘 코코타일로 agi 올해에서 29년으로 예측 [9]	ㅇㅇ	05.16	294	1
475747	일반	Gpt5되면 유비쿼터슨지 뭔지 슬슬 될듯	ㅇㅇ(121.131)	05.16	80	0
475746	일반	오픈AI 최고 수준 인력 대체까지 5년? ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1]	ㅇㅇ	05.16	368	1
475745	일반	알트만이 씨부린것보다 머스크타임이 더 정확함 [3]	ㅇㅇ(121.144)	05.16	176	0
475744	일반	베터리쪽 분야는 생각보다 오래걸릴 것 같음	ㅇㅇ(121.159)	05.16	65	0
475743	일반	agi 2029론은 알트만이 아니라 머스크였구나 [11]	ㅇㅇ(211.184)	05.16	248	0
475742	일반	꿀벌도 사칙연산이 가능한데 [5]	ㅇㅇ(121.159)	05.16	150	0
475741	일반	념글 요약하면 이건가? [2]	ㅁㄱㅌㅊ(14.47)	05.16	231	0
475739	일반	금속에 동전 떨어지는 소리 정확한 거 같은데 [1]	ㅇㅇ	05.16	183	0
475737	일반	지금 성능 꼬라지보니까 2030년엔 작살나겠다 [5]	ㅇㅇ(117.20)	05.16	407	0
475736	AI창 AI창작	내 그림을 보정하고 사람으로 만들기 [7]	ㅇㅇ(211.109)	05.16	330	0
475735	AI창 AI창작	거의 다 그린 그림 AI가 마지막 보정만 살짝 해줌 [48]	ㅇㅇ(211.109)	05.16	4941	47
475734	일반	코딩은 보니까 데이터 많은 건 잘하고 없는 건 개못하네 [6]	ㅇㅇ(112.152)	05.16	248	0