GPT-SoVITS声音模型训练

alex 收录于类别 AIGC

2024-04-10 2024-04-10 约 1790 字预计阅读 8 分钟

GPT模型列表 GPT_weights/mangev2-e15.ckpt SoVITS模型列表 SoVITS_weights/mangev2_e8_s72.pth

GPT-SoVITS 使用步骤：

音频人声分离–>分割音频–>生成slicer_opt.list –> 打标–》人工核对 –》Dataset formatting –> SoVITS training【SoVITS_weights and GPT_weights】 –> inference

音频人声分离

下面Model特色或适用场景分别是什么。 HP2_all_vocals HP3_all_vocals
HP5_only_main_vocal 得到人声 onnx_dereverb_By_FoxJoy 消除混响 VR-DeEchoAggressive 消除回音 VR-DeEchoDeReverb 去回音去混音 VR-DeEchoNormal 温柔的去回音去混音

一般我是用音频HP5_only_main_vocal 得到人声。

如果声音很吵，我会用HP5_only_main_vocal 得到人声再次进行VR-DeEchoDeReverb。

音频分割

降噪后的声音清澈。但音色范围小。感情色彩饱和度有所降低。

未降噪声音大。稍微有点背景音乐的杂音。但感情色彩饱和度高。真实。

所以看数据的情况来是否训练。

分割的音频降噪

D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\vocal_wav103_hmdh7.wav_10.wav_320_117760.wav    hello,哦。我是慢歌的助理。
D:\Software\AI\GPT-SoVITS-beta\logs\mangev2\5-wav32k\vocal_vocal_wav103_2t5nyv4dn.wav_10.wav_3780800_3855360.wav  安安稳稳过日子.
D:\Software\AI\GPT-SoVITS-beta\logs\mangev2\5-wav32k\vocal_vocal_wav103_2t5nyv4dn.wav_10.wav_3547200_3686400.wav 何必呢?大好河山处处是好姑娘.
D:\Software\AI\GPT-SoVITS-beta\logs\mangev2\5-wav32k\vocal_vocal_wav103_2t5nyv4dn.wav_10.wav_69440_302080.wav  一 
D:\Software\AI\GPT-SoVITS-beta\logs\25325803342\5-wav32k\okvocal_25325803342-allc1k_jmjh.wav_10.wav_320_132800.wav  我要开始充电了，不许乱动

– 降噪处理训练数据

D:\Software\AI\GPT-SoVITS-beta0306fix2\output\uvr5_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav #先HP5得到人声instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav， 再把这个进行VR-DeEchoDeReverb 去回音去噪音得到tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt   训练必须
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\asr_opt\denoise_opt.list  训练必须

— 不降噪处理训练数据

D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt
D:\Software\AI\GPT-SoVITS-beta\output\asr_opt\slicer_opt.list

1Ba-SoVITS training【Total epochs】. The model is located in SoVITS_weights.

GPT-SoVITS-beta：

训练参数: 1Ba-SoVITS training的 Total epochs 8 ，1Bb-GPT training的Total training epochs 15.

得到SoVITS_weights： tieniu_denoise_e16_s176.pth tieniu_not_denoise_e16_s176.pth

GPT-SoVITS-beta0306fix2：

训练参数: 1Ba-SoVITS training的 Total epochs 25 ，1Bb-GPT training的 Total training epochs 15.

得到SoVITS_weights： tieniu_denoise_e12_s132.pth tieniu_not_denoise_e24_s264.pth

改进：1Bb-GPT training的 Total training epochs 15. 调高还原越精细。调到24.

– 推理参考音频

D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0001533440_0001675200.wav  当你突然变成了那个他最熟悉的陌生人时。
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0001533440_0001675200.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0002169920_0002342080.wav  可能有的姐妹们会担心自己没有舞蹈基础。
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0002169920_0002342080.wav

D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0000244480_0000428800.wav   
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0000244480_0000428800.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0001047040_0001171200.wav   
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0001047040_0001171200.wav

如果使用 tieniu_not_denoise-e15.ckpt tieniu_not_denoise_e16_s176.pth 但用denoise的参考音频声音大。 tieniu_denoise_e12_s132.pth

1 tieniuv3-hp5版本

http://0.0.0.0:9874/
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\uvr5_opt\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav #HP5得到人声  没有去回音去噪音处理

D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5

D:\Software\AI\GPT-SoVITS-beta\output\asr_opt\tieniuv3-hp5.list

训练参数:

1Ba-SoVITS training的 Total epochs 15 ，1Bb-GPT training的Total training epochs 25.

如果报cuda内存错误。

orch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 23.99 GiB total capacity; 4.34 GiB already allocated; 17.88 GiB free; 4.49 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

需要重启win11.什么程序不要开启。只运行GPT-SoVITS-beta 网页浏览器edge notepad++ 文件浏览器

问题解决。

推理声音还可以。

2 tieniuv3-hp5-epochs48

D:\Software\AI\GPT-SoVITS-beta0306fix2\output\uvr5_opt\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav

D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5

D:\Software\AI\GPT-SoVITS-beta\output\asr_opt\tieniuv3-hp5.list

训练参数:

1Ba-SoVITS training的 Total epochs 15 ，1Bb-GPT training的Total training epochs 48.

D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav_1401600_1533440.wav 一定会给他带来更多的惊喜和好奇。


D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav_2169920_2342080.wav 可能有的姐妹们会担心自己没有舞蹈基础。

D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav_3511680_3679040.wav  ....却等于掌握了

tieniuv3-hp5-epochs48 推理声音可以

2.1 BADA

先 hp5 得到

VR-DeEchoNormal 得到

VR-DeEchoDeReverb 得到 D:\Software\AI\GPT-SoVITS-beta\output\uvr5_opt\如何改善跳舞不自信和自卑-BADA-VR-DeEchoDeReverb.wav 如何改善跳舞不自信和自卑-BADA-VR-DeEchoDeReverb.wav

切片得到

D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\BADA-hp5-VR-DeEchoDeReverb-60毫秒停顿

D:\Software\AI\GPT-SoVITS-beta\output\asr_opt\BADA-VR-DeEchoDeReverb-60毫秒停顿.list

训练名字：BADA-VR-DeEchoDeReverb

1Ba-SoVITS training的 Total epochs 15 ，1Bb-GPT training的Total training epochs 48.

D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\BADA-hp5-VR-DeEchoDeReverb-60毫秒停顿\如何改善跳舞不自信和自卑-BADA-VR-DeEchoDeReverb.wav_1280_258880.wav |如何改善跳舞不自信自卑以及学习过程中放不开的状态呢？按照这三点去做，你会慢慢遇见那个你喜欢的自己。

目录

目录

GPT-SoVITS声音模型训练

1 tieniuv3-hp5版本

2 tieniuv3-hp5-epochs48

2.1 BADA

相关内容

目录

GPT-SoVITS声音模型训练

1 tieniuv3-hp5版本

2 tieniuv3-hp5-epochs48

2.1 BADA

相关内容

GPT-SoVITS模型训练记录