디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[리뷰] 인터뷰·회의 내용을 빠르고 정확하게 텍스트로 변환한다... AI속기사 '클로바노트'

IT동아갤로그로 이동합니다. 2022.08.31 16:45:44
조회 1711 추천 0 댓글 4
[IT동아 정연호 기자] 다른 사람이 말하는 내용을 속기하는 건 어려운 일이다. 수업이나 회의, 인터뷰에서 들려오는 말을 다 적다 보면 내용을 놓치는 일이 부지기수다. 또한, 기록에만 집중하게 되면 내용 자체에 집중하지 못하게 된다. 그래서, 수업이나 인터뷰에 편하게 참여하기 위해, 대화 내용을 녹음하고 이후로 음성파일을 들어서 이를 텍스트로 옮겨 적는 사람이 많다.

문제는 녹음파일을 텍스트로 옮기는 작업에 드는 시간이다. 1시간 분량의 녹음파일이라면 모든 문장을 다 일일이 적고서 내용을 보기 좋게 정리하는 데만 2~3 시간 정도 걸린다. 생각보다 많은 시간을 내용 정리에만 써야 하는 것이다.

평소 이런 문제를 겪고 있었다면 STT(Speech to text) 서비스를 활용하는 것도 좋은 방법이다. STT는 컴퓨터가 사람의 언어를 해석해 이를 문자로 변환하는 기술을 말한다. 최근 STT 기술은 화자의 발음이 많이 어눌하거나, 단어 자체의 발음이 어려운 경우가 아니라면 오타를 거의 내지 않는 수준으로 기술이 발전했다. 한국어로 진행된 대화라면 오타는 드물게 발견된다.


AI를 활용한 STT 서비스 클로바노트, 출처=네이버



대표적인 STT 서비스엔 네이버의 클로바노트가 있다. 네이버 계정만 있으면 누구나 무료로 이용할 수 있다. 클로바노트 웹이나 앱에서 음성파일을 등록하고, 대화에 참여한 사람의 수와 해당 대화의 성격(인터뷰, 강연 등)을 설정하면 텍스트화가 가능하다.

클로바노트를 쓰기 전엔 STT 기술을 활용할 생각을 한 적이 없었다. 음성 인식도가 떨어질 것이란 편견 때문이었다. STT의 결과물에 오탈자가 많거나 대화 내용이 제대로 적혀 있지 않다면 이를 교정하는 데 들어가는 시간으로 인해 배보다 배꼽이 더 커질 것 같았다.


클로바노트에 웹페이지에서 서비스를 이용하는 방법. 대화 내용에 영어가 조금 들어간다면 인식 언어를



클로바노트 결과물을 보면 음성 인식도는 완벽하진 않지만, 훌륭하다는 평가를 받을 만하다. 회의나 인터뷰 내용을 정리할 때 큰 도움을 받을 수 있을 것이다. 오타가 적어 교정 등의 후처리 작업도 금방 끝낼 수 있어 만족스럽다. 상대방 목소리를 스마트폰 마이크와 가까운 거리에서 녹음하는 인터뷰나 전화 통화는 오탈자가 정말 드물게 발견된다. 키보드로 직접 내용을 적는 것보다 정확도가 높다.

오탈자가 나더라도 ‘면도기’를 ‘면독’로 작성한 것처럼 특정 단어에 오타가 발생하는 정도다. 이런 경우라면 앞뒤 문맥으로 무슨 단어인지 유추가 가능해, 해당 부분의 음성을 듣고서 내용을 확인할 필요가 없다. 강의나 콘퍼런스처럼 스피커를 통해서 전달되는 내용을 녹음한 파일도 음성 인식도가 훌륭하다. 화자의 목소리가 소음과 같이 녹음됐다면, 소음이 너무 심하지 않은 경우엔 문장이 정확하게 인식된다. 다만, 선풍기 소리처럼 너무 큰 소음이 잡혀 있다면 목소리 인식이 안 되는 상황도 있으니 주의가 필요하다.


talk라고 발음한 부분이 chuck으로 기록됐다. 영어의 경우 오탈자가 한국어보단 많이 나타난다



영어의 경우엔 인식도가 떨어진다는 점을 감안해야 한다. 영어 문장은 전체 문장에서 단어들이 잘못 적히는 일이 종종 발생한다. 다만, 다른 국내 STT서비스와 비교했을 때 클로바노트의 영어의 인식도는 높은 편으로 보인다.


시간과 말하는 화자에 따라서 음성 내용이 깔끔하게 정리된다



클로바노트가 인상적이었던 점은 내용을 타임라인과 화자에 따라 정리해준다는 것이다. 해당 문장을 누르면 그 부분의 음성이 재생된다. 문맥상 무슨 단어를 쓴 건지 유추하기 어려울 때 이 기능으로 음성을 듣고 원래 단어나 문장을 확인할 수 있다. 음성을 텍스트화하는 속도도 빠른 편이다. 1시간 이상의 음성 파일을 텍스트로 변환하는 데 1분도 채 걸리지 않았다.


변환된 텍스트를 복사하는 방법



전체 내용을 복사하려면 오른쪽 옆에 세로로 된 점 세 개를 누르면 된다. 음성 기록 다운로드를 누르면 워드, 한글, 텍스트, 엑셀 등 문서 형식에 맞춰서 전체 기록을 다운받을 수 있다. 일부 내용만 복사하려면 문장 위에 마우스 커서를 놓고, 오른 쪽 위에 나타난 세 개의 점을 누르면 ‘텍스트복사’를 할 수 있다.


텍스트로 변환된 내용을 워드 문서로 다운받아봤다



클로바노트는 현재 베타 서비스 동안 모든 이용자에게 매달 300분의 무료 사용 시간을 제공하고 있다. 앱에서 녹음 파일을 변환하면 시간 제한 없이 무료로 이용이 가능하다. 인터뷰를 많이 하는 특성상 무료 시간만으로는 부족할 때가 있어서 기자의 경우엔 웹과 앱을 함께 이용하고 있다. 유료로 서비스를 이용하고 싶어도 현재는 유료 서비스를 제공하지 않고 무료 사용 시간만 제공하고 있다. 네이버 측은 “베타테스트 이후로 유료화 도입과 관련해선 아직 결정된 게 없다”라고 전했다.

클로바노트를 비롯해서 현재 무료로 이용할 수 있는 다양한 STT 서비스들이 있다. 구글의 ‘음성 자막 및 변환 알림’이나 카카오의 ‘헤이카카오’ 등 편리한 서비스들이 많이 있고, 음성 인식도도 클로바노트에 견줄 만하다.

실제로 여러 서비스를 이용해보니, 가장 중요하게 느껴진 건 서비스를 편리하게 이용할 수 있도록 하는 편의 기능이었다. 이용을 하면서 편리함이 체감됐던 건 타임라인과 화자에 맞게 내용을 정리하는 클로바노트였다. 여러 명이 대화에 참여했다면 누가 무슨 말을 했는지 구별을 하는 것도 속기 과정에서 중요하기 때문이다. 화자에 따라 대화 내용이 정리가 안 되면, 누가 말한 내용인지 확인하기 위해서 음성 파일을 듣고 목소리를 일일이 구별해야 한다.

클로바노트 결과물을 보면 누가 말을 했는지도 상당히 잘 구별돼서 정리가 돼 있다. 텍스트를 누르면 음성이 나온다는 것도 오타를 수정하는 데 큰 도움이 됐다. STT서비스는 음성 내용을 텍스트로 변환할 일이 많은 사람에게 큰 도움이 될 것이다. 무료로 제공되는 서비스이니 이 기회에 한번 STT 서비스들을 체험해봐도 좋을 듯하다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [모빌리티 인사이트] 비행기 엔터테인먼트 서비스의 진화, "승객만을 위한 게 아닙니다"▶ [모두를 위한 인공지능] 5. 우리에게 '데이터'는 어떤 의미인가▶ [모두를 위한 인공지능] 4. 인공지능이 아무리 발전해도 결국 사람의 '경험'이 중요하다



추천 비추천

0

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
3416 [IT애정남] 한쪽 이어폰을 교체한 경우, 양쪽 이어폰을 연결하려면? [3] IT동아갤로그로 이동합니다. 01.31 595 0
3415 [IT애정남] 휴면회원이 활성 회원으로··· 왜 자꾸 안내가 올까요? [4] IT동아갤로그로 이동합니다. 01.31 1926 9
3414 푸조 “올해 ‘E-408·E-5008 전기차 투입’과 ‘챗GPT 적용’으로 승부수” [2] IT동아갤로그로 이동합니다. 01.31 732 1
3413 [KTVF] 원컴 “궁극형 QiFi 솔루션으로 무선 충전 기술 보편화에 앞장서겠습니다” IT동아갤로그로 이동합니다. 01.31 99 0
3412 [EV 시대] ‘영국 EV 인프라’ 살펴보니...가로등에도 충전시설 구축 [3] IT동아갤로그로 이동합니다. 01.30 472 0
3411 [IT하는법] 외부 앱 설치 차단으로 스마트폰 피싱 막는 법 [4] IT동아갤로그로 이동합니다. 01.30 1144 0
3410 LG전자, 중기부와 함께 ‘디지털 헬스케어’ 스타트업 찾는다 IT동아갤로그로 이동합니다. 01.30 137 0
3409 IBM-한국퀀텀컴퓨팅, IBM 왓슨x 및 양자 컴퓨터 국내 도입 위해 협력 [6] IT동아갤로그로 이동합니다. 01.30 793 2
3408 [KTVF] 칼렛바이오 “글로벌 포장 산업의 표준이 되겠습니다” IT동아갤로그로 이동합니다. 01.30 89 0
3407 [혁신스타트업 in 홍릉] 픽셀로 “눈 건강 관리, 안구 질환 예방하는 아이케어 솔루션” IT동아갤로그로 이동합니다. 01.30 143 0
3406 [뉴스줌인] 본격 출시 시작한 ATX 3.1 파워 서플라이, 바뀐 점은? IT동아갤로그로 이동합니다. 01.30 477 0
3405 [리뷰] 온디바이스 AI를 위한 중견급 CPU, AMD 라이젠 5 8600G IT동아갤로그로 이동합니다. 01.29 103 0
3404 [주간투자동향] 에니아이, 157억 원 규모의 프리-시리즈A 투자 유치 IT동아갤로그로 이동합니다. 01.29 130 0
3403 겨울철 주행거리 줄어드는 ‘전기차’ 사용…이렇게! [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 01.29 131 0
3402 LG전자 '올레드 에보' TV 활용, 글로벌 AI 아티스트 작품 선보여 IT동아갤로그로 이동합니다. 01.29 138 0
3401 [뉴스줌인] 에이서의 레이저 하이브리드 빔프로젝터, 뭐가 다를까? [2] IT동아갤로그로 이동합니다. 01.26 4067 2
3400 [리뷰] 작고 가벼운데, 출력은 기대 이상··· 픽스 파워소닉 XHS-701 헤어 드라이기 IT동아갤로그로 이동합니다. 01.26 125 0
3399 [자동차 디자人] 프랑스 대표 車 브랜드 ‘푸조’ 디자인 수장 ‘마티아스 호산’ IT동아갤로그로 이동합니다. 01.26 116 0
3398 [스타트업 법률실무 마스터링] 스타트업 법률실무 (1) 공동창업자간 분쟁방지 계약 및 실제 IT동아갤로그로 이동합니다. 01.26 101 0
3397 인텔, 미국 뉴멕시코주에 반도체 생산시설 ‘팹 9(Fab 9)’ 오픈 IT동아갤로그로 이동합니다. 01.26 101 0
3396 생성 인공지능, 스마트폰 품 속으로 [2] IT동아갤로그로 이동합니다. 01.26 954 0
3395 디딤 365, 네이버클라우드와 손잡고 '하이퍼클로바X' 확산 나선다 IT동아갤로그로 이동합니다. 01.26 127 0
3394 오라클 “클라우드 ‘빅4’에 등극한 OCI, 서비스 전반에 생성형 AI 적용” IT동아갤로그로 이동합니다. 01.26 125 0
3393 [시승기] 강렬한 디자인과 돋보이는 실내 공간...‘디 올 뉴 싼타페’ IT동아갤로그로 이동합니다. 01.25 78 0
3392 끊이지 않는 공공전산망 장애, AI 도입으로 해결 가능? [4] IT동아갤로그로 이동합니다. 01.25 466 1
3391 에티버스, 오라클 클라우드 서밋 계기로 OCI 사업 본격 확대 IT동아갤로그로 이동합니다. 01.25 82 0
3390 [KTVF] 파이퍼블릭 “개인도 초대형 상업용 부동산에 투자할 수 있습니다” [4] IT동아갤로그로 이동합니다. 01.25 818 1
3389 아카마이코리아 이경준 대표 “우린 너무 가까워 의식하지 못하는 ‘산소’ 같은 기업” IT동아갤로그로 이동합니다. 01.24 149 1
3388 정중동 화웨이, 자체 부품·앱 생태계 구축에 박차 IT동아갤로그로 이동합니다. 01.24 135 0
3387 ‘AI 에이전트’와 출장 준비해보니…미팅 제안 글부터 영상 내용 요약까지 수행 [6] IT동아갤로그로 이동합니다. 01.24 1658 4
3386 딘트 신수진 대표, “예상치 못한 주문 폭주도 풀필먼트로 유연하게 대응합니다” IT동아갤로그로 이동합니다. 01.24 143 0
3385 [리뷰] 무선 이어폰으로 돌아온 미키 마우스‘아이리버 엠플레이어 프리’ [7] IT동아갤로그로 이동합니다. 01.24 1391 11
3384 세일즈포스, ‘NRF 2024’에서 AI 기반의 쇼핑 및 마케팅 솔루션 선보여 IT동아갤로그로 이동합니다. 01.24 80 0
3383 LG유플러스 “인공지능 VOC LAB으로 소비자 만족 이끈다” IT동아갤로그로 이동합니다. 01.24 132 0
3382 아카마이 “CDN∙보안에서 거둔 성과, 과감한 클라우드 전략으로 이어갈 것” IT동아갤로그로 이동합니다. 01.23 90 0
3381 [IT애정남] 스마트폰 바꿨는데, ‘eSIM’이 무엇인가요? [2] IT동아갤로그로 이동합니다. 01.23 653 0
3380 [자동차와 法] 전기차 보급과 기계식 주차장에 대한 고찰 IT동아갤로그로 이동합니다. 01.23 99 0
3379 '10년 족쇄' 단통법 폐지된다··· 스마트폰 구매, 어떻게 바뀔까 [14] IT동아갤로그로 이동합니다. 01.23 2377 7
3378 [스타트업-ing] 큐어버스 “뇌질환·다발성 경화증 저분자 신약 개척” IT동아갤로그로 이동합니다. 01.23 92 0
3377 토스뱅크, 평생 무료 환전서비스 출시...경쟁사와 차이점은? [5] IT동아갤로그로 이동합니다. 01.22 648 3
3376 [IT애정남] 쏟아지는 휴대폰 알림, 지우는 방법 알려주세요 [6] IT동아갤로그로 이동합니다. 01.22 1083 1
3375 갤럭시 S24 ‘울트라’만 강조하는 삼성, 기본∙플러스 모델은 어떻기에? IT동아갤로그로 이동합니다. 01.22 259 0
3374 [리뷰] 젖은 모발 그대로 말린다, 다이슨 에어스트레이트 스트레이트너 IT동아갤로그로 이동합니다. 01.19 204 0
3373 [리뷰] 가성비 좋은 올인원 로봇청소기, 아이리버 에이클 INS-200 IT동아갤로그로 이동합니다. 01.19 118 0
3372 벤츠, 완전변경 ‘더 뉴 E클래스’ 출시…”올해 韓 시장에 신차 9종 투입” [19] IT동아갤로그로 이동합니다. 01.19 4531 5
3371 삼성전자 갤럭시 S24 시리즈 예약 판매, 판매처별 혜택은? [4] IT동아갤로그로 이동합니다. 01.19 1241 3
3370 [스타트업 법률실무 마스터링] 연재를 시작하며 IT동아갤로그로 이동합니다. 01.19 99 0
3369 [월간자동차] 23년 12월, 신차·중고차 판매량 다시 감소세...BMW 5시리즈 수입차 1위 [3] IT동아갤로그로 이동합니다. 01.18 424 0
3368 [KTVF] 딜리버리랩 “저렴한 식자재 구매와 배송, 오더히어로에 있습니다” IT동아갤로그로 이동합니다. 01.18 114 0
3367 삼성전자 갤럭시 S24 시리즈 첫 공개, 핵심 키워드는 ‘AI’ IT동아갤로그로 이동합니다. 01.18 135 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2