ai로 담당돌에게 노래를 커버시켜보자 (Diff-SVC 튜토리얼)

건조딸기칩 · 2023.02.11 00:45:01

위 동영상은 소스가 되는 목소리, 출력물, 원본 노래를 들어볼 수 있는 영상이다. 데레의 사토 신 보이스로 만들어진 모델을 사용함

1. 준비 단계

일단 데이터셋을 준비해야 하는데, 반주와 화음이 없는 노래 음성, 배경음과 잡음이 없는 말하기 음성을 준비하자. 추가적으로 숨소리 같은 것도 넣을 수 있음

준비했다면 파일을 전부 최소 1초~최대 15초가 되게 잘라준다. 자른 파일엔 공백이 없는 편이 좋음.

그리고 위 파일들을 전부 44100Hz, 16비트 모노채널 wav파일로 변환시켜야 한다.

전부 변환시켰다면 압축시켜주자. 그러면 데이터셋 준비는 끝임

참고로 노래 음성이 더 많은 게 좋긴 한데 전부 노래 음성만 넣거나 말하기 음성만 넣어도 노상관, 다만 말하는 음성만 넣었을 시에 다소 어색할 수 있음.

2. 코랩 사용 (데이터 전처리/훈련)

https://colab.research.google.com/drive/1kiUvz1TrNJa_MOfOld7DHanv4gZsl7MN

Google Colaboratory

Google Colaboratory

colab.research.google.com

데이터셋을 쓰기 위해선 일단 구글드라이브와 마운트를 해야 한다. Mount Google Drive를 누르고 팝업에서 계정 선택하면 금방 됨.

그리고 GPU 체크 어쩌구가 있는데 이건 필수도 아니고 괜히 시간 더 드니까 안해도 노상관

스텝 1에서 툴을 다운받을 때 Official Diff-SVC Repo와 UtaUtaUtau Diff-SVC Repo가 있는데 후자로 다운받기로 하자. 왜냐면 후자가 더 깔끔하게 뽑힘.

스텝 2는 Decompress dataset인데 데이터셋을 전처리하는 단계임

모델의 이름을 정하고 dataset_location에 데이터셋을 업로드했던 구글드라이브 경로를 복붙하고 실행하면 된다. 데이터뎃 음역대가 좁은 경우에는 Attempt to increase range 옵션에 체크하고 실행시켜보자. 보통 10초 이내로 끝남. 대신 Attempt to increase range 옵션에 체크했으면 더 오래 걸린다

2-A는 그냥 넘어가면 됨

그 밑엔 Training Options/Parameters 탭이 있을 텐데 어떻게 설정하냐면

use_crepe 체크 해제

use_pretrain_model 체크 (완성된 다른 모델을 기반으로 니 모델을 훈련시키는 건데 안쓰면 들어줄만한 결과물 나올때까지 개오래 훈련시켜야되니까 체크하자)

use_save_dir 체크 (이거 체크 안하면 훈련 파일 다 날아가니까 꼭 체크하고 경로도 제대로 지정해주자)

resume_training_from_ckpt 항목은 전에 훈련시켰던 파일에서 불러오기 해서 이어 훈련하는 건데 이 글 읽는 사람들은 다 처음 시작하는 걸 테니까 체크 ㄴㄴ

endless_ds 항목은 배치사이즈를 늘려서 작은 크기의 데이터셋의 품질을 향상시키는 옵션인데 니 데이터셋 총 길이가 1시간이 안되면 꼭 체크하셈.

다 셋팅했다면 이 항목을 한 번 실행하고 다음으로 넘어가면 된다. 이것도 실행하면 10초정도 걸림

다음 탭은 트레이닝인데, 본격적으로 훈련을 하기 전에 데이터를 전처리해야 된다. 그냥 버튼 한번 누르면 자동으로 되는데 이거 시간이 좀 오래 걸림. 600개 파일 전처리하는데 50분 걸린다. 딴거하면서 기다리도록 하자

스텝 4랑 5 사이에 Tensorboard란걸 활성화시킬수 있는데 훈련 진행상황을 그래프로 보여주는 GUI임. 딱히 안 실행시켜도 상관없음

그리고 스텝 4 전처리가 다 끝났으면 드디어 데이터를 훈련시킬 수 있다!!

이것도 걍 실행버튼 한번 눌러주면 되고 이건 일정시간 되면 끝나는게 아니라 계속 돌아감. 걍 니가 만족스러운 결과물이 뽑힐때까지 계속 훈련시키면 된다. 난 사전학습모델 썼을 때 기준으로 4만스텝 정도면 좀 들을만하게 나오고 6만스텝부터는 꽤 괜찮았던 거 같음

3. 노래 출력

그리고 갤럼들이 원할 파트

바로 노래를 뽑는 방법

저 위에 코랩에서도 가능한데 어째 난 자꾸 오류가 나서 이걸 주로 씀

https://colab.research.google.com/drive/1zGPrh-qxscYU2mvhiv8rrjqEn0WHnOOF?usp=sharing

Google Colaboratory

Google Colaboratory

colab.research.google.com

이것도 똑같이 구글드라이브 마운트 후 툴 받아줘야 하는데 꼭 UtaUtaUtau 레포로 받고 Load Model 탭에 모델이름 .ckpt 파일이랑 config.yaml 파일 있는 경로 복붙해주고 실행하면 모델이 로드됨.

그리고 원본 소스가 될 노래를 넣어야 하는데 노래파일도 반주 없고 44100Hz 16비트 모노 wav파일만 됨

upload your reference audio와 Import your audio 항목이 있는데 전자로 하면 노래파일 올리는데 개오래걸리니까 다른 방법을 쓰자.

Import your audio 한번 실행하면 Diff-SVC 폴더 밑에 Batch_audio 폴더가 생기는데 우선 니 드라이브에 노래파일 옮기고 Batch_auido 폴더에 옮겨주면 됨

Input audio and adjust parameters 항목은 이것저것 설정하고 노래파일을 전처리하는 단계임.

키 Key 항목은 원본 노래의 키 설정인데 원본 노래가 좀 낮다 싶으면 1부터 12 사이의 값을 입력해보자. 마이너스값은 안됨.

그리고 나머지것들은 건들 필요 없고 use_crepe만 꼭 체크 해제하자!!!!!!! 맨날 출력물이 뭔 말보로 한보루 통째로 피운거같은 목소리로 나와서 뭔가 했는데 이게 문제였음

다 설정했으면 실행하면 됨. 노래길이 따라서 30초에서 2분정도 걸림

위 과정이 끝났으면 Zip up the result to your drive 칸에 압축파일 이름을 써주고 Delete old inputted wav and rendered wav를 실행한 뒤 드라이브에 저장되어있는 압축파일을 다운받아 출력된 파일을 실행하면 된다!

4. 팁

데이터셋을 준비해야 되는데 무반주 노래파일이 없다? 커버시키고 싶은 노래의 무반주버전이 없다?

그럼 이 사이트를 이용하자

https://studio.gaudiolab.io/

mr과 보컬을 분리시켜주는 사이트인데 여러 툴이나 사이트 써보고 비교한 결과로는 이게 가장 나았음

-끝-

뭐 오류나거나 궁금한점 더 있으면 댓으로 질문해주셈

출처: 아이돌마스터 갤러리 [원본 보기]

번호	제목	글쓴이	작성일	조회	추천
설문	소속 연예인 논란에 잘 대응하지 못하는 것 같은 소속사는?	운영자	25/04/21	-	-
공지	실시간베스트 갤러리 이용 안내 [3115/2]	운영자	21.11.18	11730499	538
324969	[야갤] "XX 말고 처먹어" 치매 노모 때린 요양보호사…홈캠 본 가족들 분노 [7]	감돌	13:15	296	1
324966	[도갤] 서울 대형로펌 변호사가 부산가서 놀란것 [51]	kkk(218.147)	13:05	2069	18
324965	[싱갤] 싱글벙글 가난하면 애낳지 말자는 요즘 2030 [332]	ㅇㅇ	13:00	5655	68
324963	[야갤] 국힘 "월 6만원에 전국 버스·지하철 이용 K원패스 추진" [159]	감돌	12:55	3474	14
324962	[미갤] 4월 24일 시황 [13]	우졍잉	12:51	3809	29
324960	[주갤] 전골에 코딱지 빠져서 안먹겠다고 했다가 신고당한 여시 [131]	ㅇㅇ(106.101)	12:45	5149	42
324959	[기갤] 공공의료 강화’ 꺼내든 李, 의료계와 또 정면출동?…이윤 ‘목적’ 아닌 [251]	ㅇㅇ(223.38)	12:40	2848	16
324957	[싱갤] 싱글벙글 일본 난리난 쿠소지지vs치규 싸움 [150]	ㅇㅇ	12:35	6548	33
324956	[야갤] 다소 충격적인 미아역 흉기 사건 목격자 증언 [200]	ㅇㅇ(106.101)	12:30	6684	149
324954	[기갤] "자다가 죽는 게 소원" 故강지용 비보 후폭풍…시댁 비난까지 [240]	ㅇㅇ	12:25	7494	64
324951	[싱갤] 존잘러들이 살면서 느낀 힘든 점 [302]	NO	12:15	15734	54
324950	[이갤] 카공족 비상…!!, 스타벅스 매장도 자리충 참교육하기 시작… [174]	갈베	12:10	9813	58
324948	[잡갤] 요즘 세대 지옥이라는 청년 분들… 저희도 힘들었어요 [542]	갈베	12:05	11329	199
324947	[싱갤] 싱글벙글 일본 볶음밥 랭킹 1위 라멘집의 마지막 날 [214]	니지카엘	12:00	23632	230
324945	[중갤] 싱글벙글 닌텐도 스위치2 일본 근황 [103]	언성을높이지마라	11:55	9712	33
324944	[미갤] 베센트, 관세 인하 가능성 있지만 2-3년 걸릴듯 [25]	코갤러	11:50	3701	15
324942	[싱갤] 싱글벙들 유부녀와 바람났던 태국 14만 유튜버 입장문 [110]	투신	11:45	15419	63
324941	[자갤] 미국에서 어코드가 소나타랑 동급이라고??? ㅋㅋㅋ [304]	ㅇㅇ(223.38)	11:40	7680	83
324939	[미갤] 문 정부, 유엔사도 속였다. [353]	윤통♡트통	11:35	19851	477
324938	[이갤] 신분증 넣고 카드 결제를?...바리바리 훔쳐가는'신개념 절도범' [186]	깐부	11:30	8842	48
324936	[싱갤] 안싱글벙글 인도 파키스탄 상황 [129]	커뮤니티	11:25	13603	109
324935	[중갤] 대법 ‘이재명 선거법’ 3일간 2차례 전합 속도전…대선전 결론낼듯 [189]	ㅇㅇ	11:20	7161	27
324932	[백갤] 맛남의 광장 참돔쇼 자세히 보기 [135]	ㅇㅇ(211.62)	11:10	9270	155
324931	[싱갤] 야구 선수 출신 사대남...야구방망이로 子 때려 살인 [208]	ㅇㅇ	11:05	8723	58
324929	[국갤] 검찰, 문재인 전 대통령 뇌물 혐의로 기소 [342]	이별의순간	11:00	14605	426
324928	[이갤] 이철규 아들 구속 [81]	도봉구	10:55	7438	72
324927	[미갤] “즉시 복용 중단"..유재석광고 '고려은단 비타민' [329]	분홍빤쓰77	10:50	17452	121
324925	[싱갤] 일본인들이 해외여행 계획할때 한국이 부럽다하는 이유 [260]	ㅇㅇ	10:45	16417	48
324924	[군갤] 무혐의로 풀려난 중국인들... 이번엔 미군기지 촬영 [456]	ㅇㅇ	10:40	14141	333
324923	[해갤] AC 밀란 코파 이탈리아 결승 진출 밀라노 더비 골 모음...gif [39]	메호대전종결2	10:35	6985	203
324921	[중갤] (jtbc단독) 건진 은신처 관봉5천만원 사진 공개 [127]	나무	10:30	6838	51
324919	[군갤] 미국은 우크라이나에게 아무것도 하지말고 협상안을 받아들이라고 최후통첩 [199]	KC-46A	10:20	12219	34
324917	[이갤] 국민의힘 오늘부터 ‘맞수’ 토론... 한동훈 - 홍준표 서로 지명 [116]	세티르	10:15	6665	21
324916	[키갤] 푸이그 벤치클리어링 요약.gif [264]	푸이그	10:10	22236	441
324915	[싱갤] 싱굴벙굴 이세계 페스티벌 난리난 상황 ㄷㄷ [492]	ㅇㅇ	10:05	35783	283
324913	[코갤] 민주당, 초등학생 3시 일괄 하교 공약 [442]	ㅇㅇ	10:00	14187	28
324912	[대갤] 대만판N번방 국민MC가 미성년 성착취 영상3000개를...대만연예계 발칵 [117]	슬로베니아	09:50	12882	38
324910	[이갤] 프랑스 여행가서 말이 안통하면 소리를 지르면된다는 유튜버 [305]	ㅇㅇ(45.134)	09:40	15525	143
324908	[싱갤] 싱글벙글 종교병 [155]	결사대	09:30	13508	55
324906	[정갤] 우주가 억까한 한 사람의 사연 [119]	대한민국인디언	09:20	14237	192
324903	[하갤] [밐갤요리대회] 꼬끼오~! 테토 국수 [42]	낫하샤	09:10	4882	47
324901	[인갤] 조나단 블로: 엘든링 ㅈㄴ못만들었노 [246]	ㅇㅇ	09:00	13409	58
324899	[유갤] 결혼식에 하객 없는 것 보다 창피한 것 [256]	ㅇㅇ(175.119)	08:50	27840	91
324897	[챗갤] gpt로 할만한거 알려드림 [139]	ㅇㅇ(116.37)	08:40	20526	72
324893	[백갤] [정보] 금악리 닭짬뽕집 탄생 비화(feat. 자동 웍) [120]	백갤러(1.247)	08:20	10424	130
324891	[이갤] 90년대부터 연재했음에도 아직도 완결 안된 일본 만화들 [171]	ㅇㅇ	08:10	16357	54
324889	[싱갤] 싱글벙글 사람을 위해 살아오신 분 [180]	결사대	08:00	22730	158
324888	[C갤] 싱글벙글 역변에 대해 얘기하는 걸그룹... [104]	쌈닭	07:51	20385	18
324885	[인갤] 개성있는 게임 그래픽 스타일 모음 [61]	ㅇㅇ	07:40	17220	63
뉴스	데뷔도 전에 ‘사계의 봄’ 주연… FNC 신예 하유준, 누구? [후IS]	디시트렌드	10:00

갤러리 검색

최근 방문

즐겨찾기

즐겨찾기 갤러리

실시간 베스트 갤러리

머리말∙꼬리말

머리말∙꼬리말

색상 설정

갤러리 정보

스포일러 경고 설정

제목에서 경고

본문에서 경고

갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

차단하기

[실시간 베스트 갤러리]

갤러리 본문 영역

ai로 담당돌에게 노래를 커버시켜보자 (Diff-SVC 튜토리얼)

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

파워링크 광고

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

실시간 베스트

뉴스

디시미디어

디시이슈

개념글[동물,기타]

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘