(스압주의) RVC AI로 최애캐 목소리로 노래를 커버하는 법

마시로빠순이 · 2023.08.17 07:10:01

결과물은 이전에 올린 마시로 ai 커버 참고하면 됨...

https://gall.dcinside.com/m/bang_dream/4705271

https://gall.dcinside.com/m/bang_dream/4705299

https://gall.dcinside.com/m/bang_dream/4711543

https://gall.dcinside.com/m/bang_dream/4711710

https://gall.dcinside.com/m/bang_dream/4711966

무튼 이런 걸 만들 거임.

나는 마시로가 좋아서 얘로 했지만 원하는 방도리캐 목소리 가져다 써도 됨

우선 적기에 앞서 내가 참고한 곳 링크를 올려둘게

https://arca.live/b/aispeech/78639996

여기에 대부분의 강좌가 다 적혀있음.

여기서는 Google Colab가 아닌 그냥 로컬(쉽게 말해 사이트가 아닌 컴퓨터만으로)로 작업을 할 거라 코랩 쓰는 사람들은 미안하지만 뒤로가기를 눌러주길 바람... 나 코랩 써보고 싶어도 계속 오류나고 뭔 소린지 몰라서 그냥 로컬로 하는 거임...

서두가 좀 길었는데 이제 시작할게

1. 작업환경 세팅

RVC를 사용하려면 최소 Nvidia VRAM 8GB 이상의 그래픽카드가 필요함. 권장 사양은 VRAM 11GB 이상이고 라데온이랑 내장 그래픽카드로는 할 수가 없으니 이 점 염두해두고 작업환경을 만들도록 하자.

먼저 https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main 에 들어가서 RVC-beta-v2-0618.7z를 다운받으셈.

귀찮은 사람들은 그냥 https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC-beta-v2-0618.7z<<여기 링크 눌러서 7z 파일 다운받으면 됨...

나는 멍청하게 이전 버전을 다운받아서 v2 학습을 여태 체험해보지 못했음.... 그래서 모든 작업과정은 아마 v1 기준일거임;;;

니들은 나처럼 잘못 다운받고 후회하지 말아라...

반디집으로 7z 파일의 압축을 풀면

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b090300ed0e8b82819be3c59b19d

이런 게 나올텐데 여기서 go-web.bat 파일을 눌러주면 실행할 수 있음

1-1. 한글로 RVC 사용하기

RVC 기본 언어는 영어거나 아니면 각자 나라의 언어로 되어있을거임. 한국어는 누가 번역해준 게 있어서 그걸로 패치하면 한국어로 RVC를 사용할 수 있음.

https://gist.githubusercontent.com/ouor/91fa2e633220b5b8f7203aacd7857dd2/raw/0600755f9f6f2d56b43fef2bcd3d372e3c978066/ko_KR.json

위의 링크로 들어가서 .json 파일을 다운받고

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b090620c83e2ee2e54e5420b450d

i18n이라는 폴더에 집어넣으면 한글패치 완료.

2. 데이터셋 준비

참고한 강좌 - https://youtu.be/QU-hTbvgcT8

이제 원하는 방캐의 목소리를 찾아서 다 저장해놓자.

일단 나는

① morfonica 디폴트 곡과 커버 곡의 원본 음원 파일

② 마시로의 목소리만을 한 30분가량을 녹화한 동영상을 wav 파일로 변환시킨 것(따로 편집할 필요없음. 굳이 할 거면 3~15초가량으로 나눠서 준비)

을 준비해뒀음.

데이터셋으로 사용하기 전에 주의사항이 있는데

배경음이 없어야 함
화음, 또는 겹치는 소리가 없어야 함
노이즈나 에코가 없어야 함

즉 깨끗한 음질의 목소리가 필요함

그래서 순수한 목소리만을 뽑아내기 위해 우리는 세 가지 프로그램을 쓸 거임. 원 강좌에선 그냥 RVC web에서 편집하던데 나는 안 써봐서 모르고 이것들도 써보니 꽤 좋아서 이 프로그램들로 진행하겠음.

필요한 프로그램들은 다음과 같다.

Ultimate Vocal Remover - https://github.com/Anjok07/ultimatevocalremovergui/releases (이름 그대로 음원과 보컬을 분리할 수 있음)

RipX - https://hitnmix.com/(음원의 추가적인 화음이나 노이즈를 제거 또는 분리할 수 있음. 유료 프로그램이라 체험기간이 있는데 꽤 요긴함...)

Audacity - https://www.audacityteam.org/download/ (우리가 아는 흔한 음악 편집 프로그램. 여기서는 분할 기능을 많이 애용할 거임.)

먼저 Ultimate Vocal Remover로 음원을 제거할거임.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef73242203068c5c0a14a48cf0ea35441

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b090365883b2ef7b5c39ffd10e1c

만약 UVR5를 처음 실행했다면 MDX-Net를 선택한 상태에서 Download More Models로 들어가서

1. Kim Vocal 1

2. UVR-MDX-NET Karaoke 2

3. Reverb HQ

이 세가지를 다운받고 추가로 VR Architecture 선택해서 같은 방법으로 UVR-De-Echo-Aggressive를 다운받아주셈.

원 강좌에선 위의 세가지만 사용하는데 나는 추가로 에코 더 없애려고 다운받아서 썼더니 좋아서 이 방법대로 하고 있음.

이제 Select Input에서 음원 파일들(여러 개 넣을 수 있음!!) 넣어주고 Output은 원하는 경로 설정해놓으셈.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b090345bd4e2e82af16677f37768

설정은 Kim Vocal과 UVR-MDX-NET Karaoke는 Vocals Only, Reverb HQ는 No Other Only로 설정하고

Kim Vocal 1 - UVR-MDX-NET Karaoke 2 - Reverb HQ 순서대로 변환시키면 됨.

UVR-De-Echo-Aggressive는 에코가 좀 있다 싶으면 쓰면 됨. 나는 일단 전부 (De-Echo는 aggression setting에서 20으로 했는데 별 차이를 모르겠음...)기본설정으로 하고 변환시켰음.

이렇게만 해도 충분히 음뭔과 화음이나 노이즈, 에코가 제거되지만... 막상 들어보면 겹치는 목소리나 화음이 아직 남아있는 경우가 있음... 그래서 추가로 RipX를 사용해 남아있는 잔목소리(?)들을 제거해줄거임.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef7324220353acd97a64c4fff9e4c6a6f

일단 RipX를 켜고 변환한 파일들을 죄다 프로그램 창에 끌어다 놓고

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b090655bd0b4e929185958700b75

만약 이런 창이 뜨면 다음과 같이 설정하고 Rip 버튼 누르면 알아서 목소리를 분석해줌.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef7324220366ec59cf44c13fee2f70ecb

다 분석하면 위와 같이 목소리 파형이 따로따로 분리되는데, 제대로 분리가 안 된 음원은 이것보다 더 지저분할 수 있음.

여기에서 저 줄들을 하나하나 클릭해가며 목소리 음질이 자신에게 깨끗하게 들릴 때까지 자르고 제거하며 수정하면 된다.

다 수정했다면 File - Export 눌러서 저장해주셈.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b0906008d0e9eb7eae9dcd4baa72

이 생고생을 다 했다면 축하한다. 이제 반은 온 거다...

3. 학습하기

이제 AI에게 캐릭터의 목소리를 학습시킬 수 있음.

앞서 말한 go-web.bat를 눌러서 cmd 창이 켜지면 인터넷 창이 열릴 때까지 기다리셈.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef73242203260c09da41c493a3c67885b

기다리면 이런 창이 뜨게 됨.

이제 학습하기로 들어가주면

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef73242206468c593a74a4bec37407af6

이런 창이 뜰거임.

실험 이름에는 니들이 만들 목소리 ai의 이름을 적어주고,

버전은 v2로 정해주셈.(앞서 말했지만 난 아직 v1까지밖에 체험을 못해서 차이를 모르겠음...)

학습 폴더 경로는 앞에서 만든 데이터셋의 경로임.

데이터 처리하기와 특성 추출을 눌러 차례로 출력 결과가 끝날 때까지 기다려준 다음,

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef7324220636fc49caf16120eca3c3ddc

원 클릭 학습을 눌러주면 학습을 시작하게 됨.

전체 학습 에포크 수는 보통 250을 추천하던데 나는 일단 500번 학습시켰음.

학습 현황은 cmd창에서 확인할 수 있고, 만약 이어서 학습하고 싶으면 이전에 학습했던 전체학습 에포크 수에서 학습하고 싶은 양을 더 늘린 뒤 모델 학습하기를 눌러주면 된다.

참고로 학습 데이터셋을 추가하는 등으로 변경하면 오류 뜨는데 왜 이런지는 나도 모르겠음... 결론 데이터셋을 도중에 추가하면 처음부터 다시 해야 됨ㄷㄷㄷ

4. 추론하기

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef73242206b6fcdc6a11748340c9ed4fe

모델 추론에 들어가서 음색 목록과 인덱스 경로를 새로고침합니다. 를 눌러주면 앞서 니들이 만든 모델이 뜰거임.

처리할 오디오 파일의 경로는 니들이 커버시킬 보컬 파일인데 앞에서 말해준 프로그램으로 분리해서 직접 만들거나 유튜브 등에서 음질 좋은 음원과 보컬 파일을 구할 수 있음.

참고로 이 보컬 파일도 화음이나 노이즈, 에코가 없어야 더 완성도가 높기 때문에 노이즈와 에코는 최대한 죽여주고, 화음은 따로 분리시켜서 따로따로 커버시키면 됨.

이번에는 NCT 드림의 Candy로 해봄.(원곡이 더 좋지만 음질이 안 좋아서...)

음조 변경 란엔 변환할 음성의 높낮이를 조절할 수 있음. 나는 5정도로 높였음.

음높이 추출 알고리즘은 harvest와 crepe 중에서 원하는 걸 고르면 됨.(여태 만든 마시로 ai 커버는 죄다 harvest로 설정한 거였음.)

검색 특성 비율은 사실 잘 모르겠는데 그냥 1로 설정해뒀음.

이제 음성을 변환해주면 ai가 음을 확인하고 커버를 해줄거임!!

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef7324220623891c1a319137189c7cfc0

좀 기다려주면 이렇게 오디오가 출력되는데, 여기서 결과를 확인할 수 있음.

결과 괜찮고!

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b0906008d2e5ba205e660c136499

이런 식으로 출력을 해주면 이렇게 커버 음원이 완성된다!!

5. 커버곡 만들기(편집하기)

이제 audacity를 켜고 앞에서 구한 배경음과 만들어준 커버 음원을 집어넣어주자.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef73242206561949dae19181be0a995b1

그러면 이렇게 되는데, 자세히 보면 원래 파형이 없어야 할 부분에도 파형이 들어가 있는 걸 볼 수 있다.

오디오 파일에 우리 귀에 안 들리는 음이 남아있어 그런건데. 이거는 가볍게 잘라주면 되므로 걱정할 필요 없다.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b090370e87e0e6791951377e4504

제거할 노이즈 부분을 선택하고

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b090660982e7bd7b0e2e7fb4cb22

클립 분할을 눌러주면

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b45cd842c04e87fcb0ca99a0b0906c0484b2e92a652fe3a79c92

위처럼 된다.

이제 이걸 Delete로 지워주면 깔끔하게 노이즈를 잘라내기 할 수 있다.

viewimage.php?id=2fbcde21dad62aa36fb2&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd4e28bbaaf2a7c3f70df31ee07e50db2b431b540050a06ee8ef73242206060c2c6f5491a93033b7122

이런 식으로 노이즈나 끊긴 음 등을 계속 편집해주면 다음과 같이 된다.

이제 최애가 노래하는 걸 감상하기만 하면 끝!

따라오느라 수고 많았다 이제 이걸로 니들도 방캐 ai 만들어서 놀 수 있음ㅇㅇ

난 이제 마시로 ai 가지고 더 놀고 오겠음 ㅂㅇ

출처: BanG Dream 갤러리 [원본 보기]

번호	제목	글쓴이	작성일	조회	추천
설문	소속 연예인 논란에 잘 대응하지 못하는 것 같은 소속사는?	운영자	25/04/21	-	-
공지	실시간베스트 갤러리 이용 안내 [3115/2]	운영자	21.11.18	11769806	538
325519	[싱갤] 씨발씨발 현재 skt 사건이 심각한 이유 [59]	ㅇㅇ	11:00	13619	83
325515	[싱갤] 싱글벙글 이제 아빠왔노 금지 [350]	ㅇㅇ(121.128)	10:40	20353	117
325514	[이갤] 탈페미의 시대가 열리고 있다 [190]	ㅇㅇ	10:30	4910	42
325512	[등갤] (상처주의) 두타산 갔다가 죽을뻔한 썰 [62]	푸끼몬	10:20	5331	29
325510	[리갤] LCK) T1 VS DK 후푸평점 [372]	ㅇㅇ	10:10	68014	303
325509	[싱갤] 오싹오싹 미국을 '좌지우지'해서 트럼프조차 못 건드는 존재 [149]	ㅇㅇ	10:00	10866	56
325507	[인갤] MYST, 그 우려먹기의 역사 [17]	ㅇㅇ	09:50	2895	17
325505	[일갤] ② 8박9일 도쿄-고치-나고야 여행기 [9]	맛챠라떼	09:40	1692	9
325504	[싱갤] 다이어트 레전드 [124]	부타코	09:30	12262	94
325502	[가갤] 알아도 쓸모없는 초콜릿 상식 (2) [27]	우주쓰레기	09:20	7065	40
325500	[싱갤] 싱글벙글 다양한국가에서 방문한다는 일본 소도시 [104]	ㅇㅇ	09:10	8474	39
325497	[프갤] [0425] 오늘이 무슨 날인지 알고 갤질하냐??? [33]	slmmom	08:50	6038	43
325495	[카연] 마법의 원리는 해명되었습니다 [38]	공궁구	08:40	9407	47
325493	[무갤] 스압) 애니 속 이세계 나거한 (feat. 방패용사) [153]	ㅇㅇ	08:30	11130	133
325491	[인갤] [소개] 지옥행 직전인 노인네들의 레트로 지옥 크롤링 [19]	NeonNoroshi	08:20	8754	26
325489	[싱갤] 추억추억 그때의 스타 유즈맵 감성 [174]	ㅇㅇ	08:10	11870	34
325487	[한갤] 00년대 초반 마이너 한국 여자 아이돌 CD 모음 [63]	ㅇㅇ	08:00	8763	58
325485	[헌갤] 서울 헌집 첫 경험 - 148회차 아미커스 - 다종 (서대문 헌집) [22]	길콩이	07:50	4233	13
325483	[이갤] 아프간에 다녀온 여자 PD가 말하는 탈레반 [307]	ㅇㅇ(45.144)	07:40	18453	174
325481	[유갤] 평양냉면이 비싼 이유.. jpg [271]	♡♥	07:30	15947	22
325479	[싱갤] 안싱글벙글 헬스장에서 상처 받은 남녀 비만인.jpg [363]	ㅇㅇ	07:20	36949	172
325475	[프갤] WWE역사상 가장 유명한 라이벌리 [72]	프갤러(112.187)	07:00	8305	29
325474	[주갤] 30대 되니까 괜찮은 남자가 없다는 블라녀 [864]	관심종자	01:55	37301	218
325472	[미갤] SKT 털린거 심각하다고 함 [1544]	ㅇㅇㅇ(218.235)	01:45	56007	893
325470	[싱갤] 싱글방글 정양보다 더 드렸습니다~ [165]	ㅇㅇ	01:35	32488	249
325468	[일갤] ③ 9박 10일 일본 배낭여행기 3일차 -2 (하코다테, 4월 17일) [11]	RN	01:25	8117	16
325466	[이갤] 내가 노력하는 걸 누군가는 보고 있으니 열심히 살아야된다 [402]	ㅇㅇ(23.27)	01:15	25831	39
325464	[싱갤] 군침군침 두릅의 충격적인 진실.jpg [403]	수인갤러리	01:05	32313	174
325462	[샤갤] 도전) 모찌 뽀삐털 만드는글 [43]	楽園	00:56	13205	31
325460	[카연] 일쌍툰 1~4화.manhwa [69]	웅쿤	00:45	15345	78
325458	[싱갤] 싱글벙글 헤어진 딸을 위로해주는 아버지 [302]	이진호	00:35	30619	65
325454	[이갤] 귀찮은 일 혼자 묵묵히 다하는 신인 여돌 멤버 [217]	ㅇㅇ(93.152)	00:15	25630	26
325452	[주갤] 한녀와 뚜렷하게 다른 일녀 [448]	주갤러(211.235)	00:05	31118	370
325450	[싱갤] 다시보는 마블 ㅂㅅ 국가 ㄹㅇ..... [270]	최철귀	04.25	41311	327
325448	[헤갤] [망한머리 구조대 미용실형] 물에 삶은 유희왕 [89]	미용실형	04.25	15161	91
325446	[주갤] 블라) 이혼 고민 [254]	관심종자	04.25	27674	196
325444	[싱갤] 싱글벙글 90년대 방송중 담배 피우는 카리스마 할매 [112]	수인갤러리	04.25	27384	37
325442	[카연] 본인쟝 보약축제 옆에서 일하는 만화 [64]	코로론바	04.25	14681	74
325440	[특갤] 네이버 하이버클로바X의 신모델을 테스트 해보았다. [178]	Cohere	04.25	21563	173
325438	[유갤] 요즘 애들 피지컬을 본 롤 프로게이머 [290]	ㅇㅇ(146.70)	04.25	42667	110
325436	[싱갤] 싱글벙글 ㄹㅇ 1박 2일이 GOAT였던 이유.... [261]	ㅇㅇ	04.25	44530	483
325432	[주갤] 남자가 지갑을 닫은 효과가 슬슬 경제지표로 나타나기 시작함 [403]	갓럭키	04.25	39384	321
325430	[한갤] (한국 여자아이돌 歷史) 연기자로 진화한 여자아이돌 [70]	러브앤피스	04.25	18691	41
325428	[미갤] 플라자 합의와 일본 버블붕괴에 대해 알아보자...1편 [221]	ㅇㅇ(39.115)	04.25	15255	74
325426	[경갤] 가방끈으로 사람을 비하하면 안됨 [475]	경갤러(211.235)	04.25	32026	212
325424	[야갤] 안양시, '얼굴로 성별인식' CCTV 논란 확산에 '폐지' 결정 [288]	감돌	04.25	22425	97
325422	[이갤] 국내 최초 1,800억 원 상당 코카인 압수, 사상 최대 마약 카르텔 [415]	ㅇㅇ(212.102)	04.25	22566	172
325420	[싱갤] 훌쩍훌쩍 히틀러를 열등감 덩어리로 만들어버린 사건 [268]	ㅇㅇ	04.25	25967	288
325418	[주갤] 블라) 내가 그렇게 돈에 미친년이야? [427]	관심종자	04.25	34861	104
뉴스	은지언니(이은지), 키모우이x톡스앤필 참석으로 빛난 자리!	디시트렌드	04.25

갤러리 검색

최근 방문

즐겨찾기

즐겨찾기 갤러리

실시간 베스트 갤러리

머리말∙꼬리말

머리말∙꼬리말

색상 설정

갤러리 정보

스포일러 경고 설정

제목에서 경고

본문에서 경고

갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

차단하기

[실시간 베스트 갤러리]

갤러리 본문 영역

(스압주의) RVC AI로 최애캐 목소리로 노래를 커버하는 법

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

파워링크 광고

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

실시간 베스트

뉴스

디시미디어

디시이슈

개념글[멍멍이]

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘