디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[SBA x IT동아] 신티아 “생성형 AI로 고품질 오디오북 대량생산 꿈꾼다”

IT동아갤로그로 이동합니다. 2024.12.10 13:25:49
조회 4843 추천 0 댓글 1
[SBA x IT동아 공동기획] 서울특별시와 서울경제진흥원(SBA)은 서울 성수·창동·동작에 창업센터를 마련했습니다. 스타트업을 발굴, 초기 창업부터 성장기까지 단계별 프로그램을 지원해 육성합니다. 2024년 두드러진 활동을 펼친, 성장 가능성이 높은 유망 스타트업을 소개합니다.

[IT동아 김예지 기자] 전통적인 종이책이 디지털을 입고 새로운 형태의 독서 방법으로 변모하는 중이다. 디지털 기기를 통해 책을 소비하는 전자책, 오디오북이 대표적이다. 특히 오디오북은 책의 문자를 음성으로 변환해 책을 듣는 방식으로, 다양한 상황에서 손쉽게 들을 수 있고, 멀티태스킹이 가능하다는 장점을 가진다. 책을 소비하는 방식이 눈에서 귀로 확장된 셈이다.

그러나 오디오북 시장은 커지는 데 한계가 있었다. 가장 큰 이유 중 하나는 높은 오디오북 제작 비용과 이로 인해 부족한 콘텐츠 수 때문이다. 오디오북 수요가 증가하는 가운데, ‘신티아’는 이를 해결하기 위해 ‘AI 오디오북 자동제작 서비스’를 출시했다. 기존의 ‘텍스트 음성 변환(TTS, Text to Speech)’ 기술에 생성형 인공지능(AI) 음성 기술을 접목해 기존 대비 오디오북 제작 시간 및 비용을 줄인 것. 나아가, 거대언어모델(LLM)은 사람처럼 자연스럽게 책을 읽어 소비자의 오디오북 경험을 극대화한다. IT동아는 오진환 신티아 대표를 만나 신티아 서비스 및 적용 기술에 대해 물었다.


오진환 신티아 대표 / 출처=신티아


효율적으로 책을 소비하는 방법 ‘오디오북’


오진환 대표는 평소 독서를 좋아했지만 책 읽을 시간이 부족해 출퇴근 시간 오디오북을 들으며 독서를 대신해 왔다. 그러나 그는 한정된 오디오북 종류 때문에 불편함을 느꼈고, 신티아의 자체 TTS 기술을 활용해 직접 오디오북을 만들어봤다. 그러나 만든 오디오북은 사람이 낭송한 오디오북과 달리 어색함이 느껴졌다. 단순한 음성 변환으로 만들어져 강약 조절, 속도 조절 등이 적용되지 않았기 때문이다.

이에 오진환 대표는 신티아의 TTS 기능에 AI 기술을 더해 책 내레이션에 특화되도록 고도화하고, 나아가 오디오북을 자동으로 제작하는 서비스를 출시하기로 결심했다. 그는 2020년 11월 법인을 설립, 본격적으로 지난해 여름부터 시장에 진입했다. 오진환 대표는 “해외에 비해 한국은 시장은 오디오북 시장 자체가 아직 활성화되지 않은 편이나, 오디오북도 콘텐츠를 소비하는 새로운 방식으로 그 수요가 늘고 있다”고 말했다.

내레이션에 특화된 자체 AI 음성 기술


신티아의 AI 음성 기술은 오디오북 제작 시간을 기존보다 대폭 줄여준다. 기존에는 성우가 300페이지 책을 오디오북으로 제작하는 데 1달이 소요됐던 반면, 신티아의 AI는 동일 분량의 이펍(Epub, 전자책 파일 포맷) 파일을 10분만에 읽고, 8-10시간 분량의 오디오북으로 만들어 MP3 파일로 제공한다.

신티아가 제공하는 오디오북에는 기본 형식인 ‘싱글 내레이션’과 ‘멀티 캐스팅’ 두 가지 버전이 있다. 멀티 캐스팅은 마치 오디오 드라마처럼 소설 등 장르에서 다양한 등장인물의 목소리를 구분해 읽어주는 방식이다. 더불어 신티아는 책 한 권을 여러 목소리 버전으로 만들어 줄 수 있다. 오진환 대표는 “사람마다 몰입도를 높여줄 수 있는 목소리가 있다. 현재 모든 오디오북은 높은 가격 때문에 하나의 목소리 버전으로 제작되지만, 신티아는 여러 목소리 버전으로 소비자 선택폭을 넓혀준다”고 덧붙였다.


신티아 서비스 이미지 / 출처=신티아



신티아의 LLM은 책을 빠르게 읽고, 본문의 등장인물을 분석해 적합한 목소리를 찾는다. 단순한 TTS는 띄어쓰기 실수가 있어도 무시하지만, LLM은 사람처럼 문법 문제를 파악하며 읽을 수 있다. LLM은 음성 엔진에게 숨소리 조절, 강약 조절, 속도 조절, 감정 표현 등 문장 읽는 법을 지시한다. 이 LLM은 모듈화돼 개별적으로 기능을 훈련할 수 있다. 책 본문에 외국어 단어 및 문장이 있어도 19개 언어 모듈 덕분에 해당 언어를 인지해 자연스럽게 소리 낸다.

다음으로 AI 음성 엔진이 목소리를 합성해 캐스팅(어울리는 목소리를 매칭하는 것)을 완료한다. 이때 사용자는 음성 복제 기술을 통해 AI, 성우, 또는 본인의 목소리를 사용할 수 있다. 예컨대, 영국식 발음을 못 하는 사용자가 영국식 발음 내레이션에 사용자 목소리를 입히면 영국식 발음을 하는 자신의 목소리를 들을 수 있다. 덕분에 고유 명사의 경우, 작가는 의도에 맞게 단어를 소리내도록 설정할 수 있다.

오디오북은 자동으로 제작되지만, 사용자가 검토 및 수정할 수 있다. 오진환 대표는 “가장 중요한 것은 자동화다. 현재는 100% 자동화가 아니지만 파일 업로드 및 변환하는 과정이 자동 제작”이라며, “멀티 캐스팅 영역 등에서 아직 개발 훈련이 필요하나, 점차 학습 데이터가 쌓이며 목소리 구분이 정확해지고 향후 자동화가 가능해질 것”이라고 말했다.

식사 한 끼 값으로 오디오북 제작한다


오진환 대표는 오디오북 제작의 가장 큰 걸림돌인 제작 비용을 낮췄다는 점을 강조한다. 그는 “미국에서는 1년에 책 약 400만 권이 출판되면 이중에서 상위권에 있는 약 2%인 8만 권만 오디오북으로 만들어진다. 그 이유는 300페이지 책을 오디오북으로 제작하는 데 수백만 원이 드는 구조 때문”이라고 설명했다. 그러면서 “오디오북으로 아직 만들어지지 않은 나머지 98% 책들을 대량생산처럼 저렴한 가격에 오디오북으로 만들겠다”고 말했다.

신티아는 오디오북 제작 완료 후, 결과물 재생 시간을 차감하는 방식으로 시간당 9.9달러(약 1만 4000원)를 과금한다. 10시간이면 99달러(약 14만원)인데, 여기에 개인이 1년권을 구독할 경우 약 20달러(약 2만 8000원)에 10시간을 제공한다. 즉, 식사 한 끼 값으로 오디오북을 만들 수 있다는 설명이다. 싱글 내레이션 가격과 멀티 캐스팅 가격은 동일하다.


오진환 신티아 대표 / 출처=IT동아


화이트 라벨 전략 B2B·개인 작가 대상 B2C 노린다


오진환 대표는 시장 본격 진출 후, 유럽과 미국 시장을 중심으로 고객군을 넓혀가는 중이다. 지난 10월 독일 프랑크푸르트 도서전에서 해외 오디오북 플랫폼 기업을 만나 협력을 논의한 데 이어 국내에서도 대형 출판사와 계약을 체결했다.

신티아는 언어별·국가별 오디오북 서비스 기업과 협력해 오디오북 제작 시장 점유율을 높일 계획이다. 오진환 대표는 “단기간에 많은 책이 신티아를 통해 오디오북으로 제작되는 과정에서 시장 점유율 확보가 중요하다”며, “국가별 유명한 파트너사에서 신티아의 기술이 사용되도록 ‘화이트 라벨(White Label)’ 전략으로 접근하고 있다”고 설명했다.

또한 신티아는 출판사를 필요로 하지 않는 미국 개인 작가와 중소형 출판사 등 B2C 시장으로의 기회도 엿본다. 장기적으로는 제작 외 플랫폼으로 진화한다는 목표다. 오진환 대표는 “현재는 개인 작가가 오디오북을 만들어 다른 플랫폼에 가져가 거래한다. 이러한 번거로움을 해소하기 위해 신티아는 오디오북 플랫폼과 연계해 직접 오디오북을 제공할 예정이다. 나아가, 향후에는 작가가 신티아에서 제작한 오디오북을 직접 판매하는 플랫폼으로 진화할 것이라 기대한다”고 말했다.

이어 그는 “대형 플랫폼은 작가의 콘텐츠를 독점하는 수익 구조를 유지하는데, 이때 작가가 콘텐츠에 주도권을 가지면 협상력을 가질 수 있다. 신티아는 오디오북 제작 서비스를 함께 제공하면서 작가에게 수익 비율을 많이 줄 수 있다”며, “오디오북은 사업의 본질이 콘텐츠다. 작가들이 더 많은 수익을 가져가게끔 하여 출판 시장의 건강한 생태계를 만들어 나가는 것이 목표”라고 덧붙였다.

IT동아 김예지 기자 (yj@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [스타트업-ing] 써티블랙 “공간음악 서비스 기반의 오디오 광고 플랫폼, 스넥스”▶ [투자를IT다] 2024년 12월 1주차 IT기업 주요 소식과 주가 흐름▶ 6G 필수 기술로 꼽히는 오픈랜, 이점 뭐길래



추천 비추천

0

고정닉 0

23

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 내 며느리, 사위로 만나면 부담스러울 것 같은 스타는? 운영자 26/03/09 - -
6761 이력서 대신 난제 던진 일론 머스크, '파격적이지만 정답이 있는 문제' IT동아갤로그로 이동합니다. 03.13 68 0
6760 그룹아이비 “23년 쌓은 범죄 데이터 무기로 韓 공급망 보안 시장 공략” IT동아갤로그로 이동합니다. 03.13 17 0
6759 울산교육청 “AI는 차단할 기술 아닌 교육의 대상…‘우리 아이(AI)’ 플랫폼 구축 배경” IT동아갤로그로 이동합니다. 03.13 19 0
6758 [IT하는법] 스마트폰 기본 앱, 삭제하거나 숨기는 법 IT동아갤로그로 이동합니다. 03.13 81 0
6757 [황성진의 '고대 사상가, AI를 만나다'] 6/완. 칸트가 AI 시대에 태어났다면 말했을 한 마디 IT동아갤로그로 이동합니다. 03.13 21 0
6756 일상 속 스며든 유선ㆍ무선 네트워크 기술, 어떻게 구현될까? IT동아갤로그로 이동합니다. 03.13 74 0
6755 "위급할수록 빠르게" 119안심콜 서비스, 취약계층 전용 아니었다 IT동아갤로그로 이동합니다. 03.12 26 0
6754 [자동차 디자人] ‘강력한 우아함’으로 ‘지커’ 정체성 구축…슈테판 실라프 디자인 총괄 IT동아갤로그로 이동합니다. 03.12 21 0
6753 레노버 테크데이 26, “기업 AI, 이제는 ‘실험’ 아닌 ‘실행’의 때” IT동아갤로그로 이동합니다. 03.12 22 0
6752 천만 관객 시대, 야구 산업 속 첨단 기술 살펴보니 IT동아갤로그로 이동합니다. 03.12 20 0
6751 2026 BCMC “블록체인은 AI 시대의 신뢰 인프라” IT동아갤로그로 이동합니다. 03.12 107 0
6750 상승기류 타는 AI PC, 2026년 'NPU 기반 온디바이스 AI' 활용도 높아진다 IT동아갤로그로 이동합니다. 03.12 65 0
6749 [주간보안동향] 이란 전쟁이 야기한 사이버 위협, 기업 대응 방안은 外 IT동아갤로그로 이동합니다. 03.12 25 0
6748 “벤처ㆍ혁신기업에 투자” 기업성장펀드(BDC)는 다른 펀드와 무엇이 다를까? IT동아갤로그로 이동합니다. 03.12 30 0
6747 [주간스타트업동향] 반프, 실리콘랩스와 지능형 타이어 모니터링 솔루션 발표 外 IT동아갤로그로 이동합니다. 03.11 93 0
6746 '모바일 확대 개편' 우리동네 기후환경정보, 기존 날씨 앱과 무엇이 다를까 IT동아갤로그로 이동합니다. 03.11 27 0
6745 디지털자산 거래소, 법인 고객 서비스 강화 ‘법인 시장 참여 대비’ IT동아갤로그로 이동합니다. 03.11 491 0
6744 SBA, 12개 대기업과 혁신 스타트업 발굴…‘2026 서울 오픈이노베이션 파트너스 데이’ 개최 IT동아갤로그로 이동합니다. 03.11 31 0
6743 [현장] 에이수스 “2026 젠북 시리즈, 촉감부터 A/S까지 차별화” IT동아갤로그로 이동합니다. 03.10 27 0
6742 지노 발리스트레리 HP UAV 총괄 "한국 드론 시장, 신속·신뢰·혁신성 돋보여" IT동아갤로그로 이동합니다. 03.10 31 0
6741 “지역에 머무는 여행, 어떻게 만들까”…에어비앤비가 제주서 내놓은 청사진 IT동아갤로그로 이동합니다. 03.10 28 0
6740 [위클리AI] 오픈AI, GPT-5.4 출시 '워크플로우 특화 모델' 외 IT동아갤로그로 이동합니다. 03.10 334 0
6739 [K-스페이스 퀀텀 점프] 5/완. 항공안전을 위한 기업문화가 만들어지는 법 IT동아갤로그로 이동합니다. 03.10 26 0
6738 '세대교체·신규 라인업 등장'··· 팀 쿡 시대 저물고 새로운 애플이 온다 IT동아갤로그로 이동합니다. 03.10 66 0
6737 [스타트업 브랜딩 가이드] 로고 제작은 디자인이 아니라 신뢰 설계다 IT동아갤로그로 이동합니다. 03.10 66 0
6736 SBA "2025 서울콘 1757억 경제효과, K 컬처 비즈니스 플랫폼으로" IT동아갤로그로 이동합니다. 03.10 31 0
6735 [IT신상공개] 누음 줄인 오픈형 이어폰 JBL 센스 프로·사운드기어 클립스 IT동아갤로그로 이동합니다. 03.10 85 0
6734 [자동차와 法] 교통안전 및 과실비율 산정에 AI 활용하는 주요국 사례 IT동아갤로그로 이동합니다. 03.10 337 1
6733 프로덕트테크 “플라스틱 폭탄 된 부직포 필터…친환경 금속 필터로 순환 경제 실현” IT동아갤로그로 이동합니다. 03.10 32 0
6732 [투자를IT다] 2026년 3월 1주차 IT기업 주요 소식과 시장 전망 IT동아갤로그로 이동합니다. 03.09 36 0
6731 갤 S26 나왔는데…'콘서트 필수폰'은 아직도 S23 울트라? IT동아갤로그로 이동합니다. 03.09 96 0
6730 10년 전 알파고와 겨뤘던 이세돌, 인공지능과 손잡은 이유 IT동아갤로그로 이동합니다. 03.09 95 0
6729 웬디미디어, 국내 최초 멀티 에이전트 AI 라이브 방송으로 갤럭시26 사전판매 73억 기록 IT동아갤로그로 이동합니다. 03.09 91 0
6728 에어비앤비 “올해 목표는 지역 여행 활성화”…제주서 꺼낸 해법은 ‘공간·콘텐츠·사람’ IT동아갤로그로 이동합니다. 03.09 29 0
6727 에이블캠퍼스 최혜린 총괄 "AI 도입, 개발 엔지니어의 고차원 교육이 내재화에 큰 역할" IT동아갤로그로 이동합니다. 03.09 35 0
6726 [주간투자동향] 사운드리퍼블리카, 시리즈A 브릿지 후속 투자 유치 外 IT동아갤로그로 이동합니다. 03.09 52 0
6725 디지털 전략에 진심인 IBK 기업은행, '두레이(Dooray!)'로 협업문화 가속 IT동아갤로그로 이동합니다. 03.09 37 0
6724 기술은 현실을 반영해야 한다: 다양한 경험이 만드는 기술 혁신 [세계 여성의 날] [5] IT동아갤로그로 이동합니다. 03.08 467 0
6723 [리뷰] 4K 240Hz에 QD-OLED? 타협 없는 게이밍 모니터, ‘레노버 리전 프로 32UD-10’ IT동아갤로그로 이동합니다. 03.06 66 0
6722 [AI 써봄] “누구라도 몇 초 만에 아티스트가 된다” 구글 나노 바나나 2 IT동아갤로그로 이동합니다. 03.06 44 0
6721 "자동차, 이제 홈쇼핑으로 사세요", 권용국 차봇모빌리티 부문장 IT동아갤로그로 이동합니다. 03.06 48 0
6720 [스타트업-ing] "스마트폰 하나로 전문 코칭까지" 키넥스, 스포츠 훈련 더 가깝게 돕는다 IT동아갤로그로 이동합니다. 03.06 41 0
6719 "무료로 3분 만에 분석" 반려식물 추천 서비스, 직접 써보니 IT동아갤로그로 이동합니다. 03.06 42 0
6718 AI의 무기화 시작한 美 정부, 'LLM'은 어떻게 알고리즘 전쟁의 종심이 됐나 [11] IT동아갤로그로 이동합니다. 03.06 1233 3
6717 넥스트챌린지, "2026 구글플레이 협업 '창구 프로그램' 참여 기업을 찾습니다" IT동아갤로그로 이동합니다. 03.06 39 0
6716 [리뷰] 실용성 더한 오픈형 이어폰, 소니 링크버즈 클립 IT동아갤로그로 이동합니다. 03.06 328 0
6715 [황성진의 '고대 사상가, AI를 만나다'] 아리스토텔레스가 보면, 요즘 AI 활용은 전부 '반쪽짜리' IT동아갤로그로 이동합니다. 03.06 44 0
6714 [IT신상공개] “최대 3cm 카펫 청소”…직배수 AS 강화한 로보락 ‘S10 MaxV Ultra’ IT동아갤로그로 이동합니다. 03.05 43 0
6713 [스타트업-ing] 모빌리티랩 "군집자율비행 드론으로 농업·재난·국방 현장 무인화" IT동아갤로그로 이동합니다. 03.05 41 0
6712 “프리미엄 내려놓고 99만 원” 애플, 중저가 노트북 맥북 네오 공개 [20] IT동아갤로그로 이동합니다. 03.05 1743 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2