디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 사람 음성 받아적는 AI도 '환각' 보여…"없는 말 지어내"

ㅇㅇ(182.230) 2024.04.28 20:32:00
조회 912 추천 15 댓글 11
														

https://m.dongascience.com/news.php?idx=65130

 



2bebd274b3836df06ced86e612d57c38e92a28cf4f895ee635eccd1e5218fe2b8f073010512ea10c13f0a821537d58

인공지능(AI) 챗봇이 때때로 잘못된 정보를 지어내거나 조작하는 '환각'을 보인다는 사실은 이미 잘 알려진 문제다. 



최근 음성을 텍스트로 바꾸는 AI 모델도 환각 증상을 보여준다는 연구 결과가 나왔다.


26일(현지시간) 국제학술지 '사이언스' 보도에 따르면 모나 슬론 미국 버지니아대 데이터과학과 교수가 이끈 연구팀은 음성을 텍스트로 변환하는 AI가 받아쓴 글에서 약 1%가 지어낸 이야기이고 그중 일부는 개인정보 조작, 폭력성 등을 드러냈다는 사실을 발견해 연구결과를 논문 사전 공개 사이트인 '아카이브(arXiv)'에 지난 2월 공개했다.


생성형 AI 챗봇은 책과 웹페이지 등 수많은 텍스트를 학습하고 앞으로 나올 단어를 예측해 출력하는 '대규모 언어 모델(LLM)'을 기반으로 작동한다. 음성을 텍스트로 변환하는 AI도 언어 모델을 음성 패턴을 학습한 모델과 결합한 시스템이다.


연구팀은 지난해 4월과 5월에 챗GPT 개발사인 미국 오픈AI(OpenAI)의 고성능 음성-텍스트 변환 AI인 '위스퍼(Whiper)'에 실어증이 있는 화자와 그렇지 않은 화자로부터 각각 20시간 분량의 음성을 들려줬다. 실어증은 천천히 말하고 중간에 멈추는 경향이 있는 언어 장애다. 내용은 개인적인 이야기나 동화 구연 등으로 구성됐다.


음성 변환 결과 실어증이 있는 화자의 말을 받아적은 글에서 1.7%의 조작된 텍스트가 포함됐다는 사실을 확인됐다. 실어증이 없는 사람의 말 중에서는 1.2%가 조작됐다. 이 중 40%는 해롭거나 폭력적인 내용이 담겼다.


예를 들어 소방서에서 구조한 고양이 이야기에 '피에 젖은 유모차'나 '애무'와 같은 내용이 추가되거나 우산에 대한 이야기에 '테러용 칼'과 '사람을 죽인다' 처럼 조작된 내용이 포함됐다. 연구팀은 "의사들은 음성-텍스트 변환 도구를 사용해 환자 기록을 필사할 수 있다"며 "환자가 약을 복용하는 방법에 대해 말을 지어낸다면 그 결과가 얼마나 심각할지 상상해 보라"고 전했다.


연구팀은 실어증 환자에게서 흔히 볼 수 있는 '긴 침묵'이 텍스트 조작의 원인이 될 수도 있다고 분석했다. 환자들이 '음' 또는 '아'라고 말하면 이를 침묵으로 해석하지 않고 가상의 문장을 만들어 낸다는 것이다.


최초 실험 이후 OpenAI는 AI가 환각 가능성을 감지하면 침묵 구간을 건너뛰고 음성을 다시 녹음하도록 업데이트했다. 지난해 12월 연구팀이 업데이트된 AI로 일부 음성-텍스트 변환 작업을 재실행하자 이전에 발견된 조작이 대부분 제거됐다.


오픈AI는 "모델 정확성을 향상할 방법을 계속 연구 중"이라며 "연구 결과를 공유해준 연구원들의 피드백을 반영해 '환각'을 개선하고 있다"고 말했다.


실어증 환자가 아니어도 외국어를 말하는 사람이나 노인의 음성 등 다른 불규칙한 음성이 환각을 일으킬 수 있다는 지적도 나왔다. 연구팀은 "다양한 화자와 말하기 스타일에 대해 AI의 훈련이 이뤄져야 한다"며 "AI로 변환한 텍스트를 중요한 결정을 내릴 때 사용한다면 사용자가 직접 내용을 확인할 것을 강력하게 권고한다"고 밝혔다.

자동등록방지

추천 비추천

15

고정닉 9

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2860 설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [27] 모브갤로그로 이동합니다. 24.01.24 5798 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2855] 특갤용갤로그로 이동합니다. 23.08.06 37143 41
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 1886 2
363220 공지 선형글 삭제 기준 [6] 특갤용갤로그로 이동합니다. 23.10.14 6488 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 12245 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [50] 특갤용갤로그로 이동합니다. 23.11.07 8225 79
385147 공지 구글의 AGI 분류 체계 [16] ㅇㅇ갤로그로 이동합니다. 23.11.22 7394 30
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 8397 29
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 21693 33
466827 일반 gpt2 also 설마 m4칩 온디바이스로 돌아가는건 아니겠지??? [2] ㅇㅇ갤로그로 이동합니다. 07:03 85 0
466826 일반 기@본소득 시행하면 오히려 사람들 자살한다던 얘기를 어디선가 들었음 [5] ㅇㅇ(14.45) 06:11 221 0
466825 일반 oai 연구원 "특붕이들이 준비됐길" [8] 선갤러(125.191) 06:09 378 0
466824 일반 근데 이제 월.드코/인의 의의는 뭐임 [3] ㅇㅇ(220.116) 06:04 140 0
466823 일반 월드 [2] ㄴㄱ(58.141) 05:56 177 0
466822 일반 벌써 떡밥 다식었다 ㅇㅇ(117.20) 05:53 146 0
466821 일반 방금 문득 든 생각 [1] ㅇㅇ갤로그로 이동합니다. 05:53 56 0
466820 일반 이번에 출시하는 오픈ai랑 찰떡궁합인 국내기업 [6] 레커(125.176) 05:52 252 1
466819 일반 오늘 oai 발표 어떻게 될지 알았다 ㅋㅋ [1] ㅇㅇ(223.39) 05:08 351 3
466818 일반 GPT5는 대선이후에 나옴 ㅇㅇ(76.38) 04:52 117 0
466817 일반 하여간 병신 새끼답게 특들갑 지리노 [1] ㅇㅇ(210.99) 04:44 207 4
466816 일반 알트만이 내일 세계정복 선언 하묜 어케댐 ㄷㄷㄷ [1] ㅇㅇ(125.188) 04:39 122 1
466815 일반 그렉 브록만 새 트윗 [1] 모브갤로그로 이동합니다. 04:37 251 3
466814 일반 미래꽃: 특들갑 ON 해라 [4] ㅇㅇ(112.144) 04:05 420 1
466813 일반 매번 gpt4 답변 출력시켜놓고 기다리면서 다른일 하는데 케이프타운의무법자갤로그로 이동합니다. 03:48 140 0
466812 일반 특갤도 펀딩같은거해서 온라인강연초청하까 [1] 떼껄룩해적단갤로그로 이동합니다. 03:44 88 0
466808 일반 근데 ai비서 영어권만 서비스하면 아무 의미 없는거넼ㅋㅋ [1] ㅁㄴㅇ(222.112) 03:24 233 0
466804 일반 진짜 무서운건.............. [8] ㅇㅇ(49.143) 03:17 370 1
466802 일반 현재외 똑같은 시뮬레이션 세상을 구축했다고 치자? [7] ㅇㅇ(124.50) 03:05 347 0
466801 일반 물리학자들이 이구동성으로 현실과 구분이 안 되는 가상현실 [4] .(27.35) 03:02 239 0
466800 일반 알트만이 뭐라하건 기술의 진보는 막을수없음 [3] ㅇㅇ(124.50) 02:57 233 0
466799 일반 딜레이 1도 없이 동시 대화 가능하면 진짜 혁신임 [1] ㅇㅇ(125.137) 02:52 228 0
466798 일반 음성 데이터가 텍스트보다 학습 성능이 뛰어나다면 갤 뒤집혀지냐? [3] ㅇㅇ갤로그로 이동합니다. 02:52 202 0
466797 일반 야 이 영업사원 알트만아 [1] ㅇㅇ(121.146) 02:51 103 0
466796 일반 도대체 어떤 음성의 신기능일까 ㅇㅇ(125.190) 02:50 70 0
466795 일반 마지노선이 ㅇㅇ갤로그로 이동합니다. 02:50 51 0
466793 일반 내가 누누히 말하지만 로봇이 배관 고칠 수 있는 날이 오면 진정한 [5] .(27.35) 02:40 237 0
466792 일반 지금도 초저지연 STT되는데 [8] ㅇㅇ(218.153) 02:35 277 0
466791 일반 결국엔 GPT4 성능보다 10% 좋은 음성 AI 비서였네.... [1] ㅇㅇ(211.179) 02:32 396 0
466790 일반 좆구리다 [3] ㅇㅇ(223.39) 02:30 193 0
466789 일반 세상이 바뀌어 가는 걸 보니까 재밌음 [1] ㅇㅇ(222.97) 02:30 133 0
466788 일반 진짜 네이밍 센스 존나 없네 [4] ㅇㅇ갤로그로 이동합니다. 02:29 438 0
466787 일반 내일 얘 나오는거임? ㅇㅇ(182.225) 02:18 147 0
466786 일반 인공지능 비서 나온데? 음성으로 컨트롤 하는거? [3] ㅁㄴㅇ(222.112) 02:17 231 0
466785 일반 24시간 남았노 ㅋㅋㅋㅋ [1] ㅇㅇ(222.101) 02:14 177 0
466784 일반 Jim Fan: 내일 OpenAI는 음성 비서 시연 예정 [11] ㅇㅇ(112.144) 02:13 588 3
466783 일반 내일 알트만 [1] 테이리갤로그로 이동합니다. 02:09 202 0
466782 일반 샘알트먼의 인생을 잘 설명한 영상 [5] ㅇㅇ(220.116) 01:57 256 1
466781 일반 이 갤 가끔 오는데 [1] ㅇㅇ(210.216) 01:55 256 0
466780 일반 걍 내가 아까 했던 미래의 ㅇㄴㅎ 상상 그대로 이어지겠노 ㄷㄷ [3] 초2때부터야동본놈(116.36) 01:54 240 0
466778 일반 also모델 보면 이게 스펙이 올라간건지 아니면 프롬프트를 조정한건지 [2] ㅁㄴㅇ(222.112) 01:48 180 2
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2