GPT模型列表 GPT_weights/mangev2-e15.ckpt
SoVITS模型列表 SoVITS_weights/mangev2_e8_s72.pth
GPT-SoVITS 使用步骤:
音频人声分离–>分割音频–>生成slicer_opt.list –> 打标–》人工核对 –》Dataset formatting –> SoVITS training【SoVITS_weights and GPT_weights】 –> inference
音频人声分离
下面Model特色或适用场景分别是什么 。
HP2_all_vocals
HP3_all_vocals HP5_only_main_vocal 得到人声
onnx_dereverb_By_FoxJoy 消除混响
VR-DeEchoAggressive 消除回音
VR-DeEchoDeReverb 去回音 去混音
VR-DeEchoNormal 温柔的去回音 去混音
一般我是用音频HP5_only_main_vocal 得到人声。
如果声音很吵,我会用HP5_only_main_vocal 得到人声 再次进行VR-DeEchoDeReverb。
音频分割
降噪后的声音清澈。但音色范围小。感情色彩饱和度有所降低。
未降噪声音大。稍微有点背景音乐的杂音。但感情色彩饱和度高。真实。
所以看数据的情况来是否训练。
分割的音频降噪
1
2
3
4
5
D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\vocal_wav103_hmdh7.wav_10.wav_320_117760.wav hello,哦。我是慢歌的助理。
D:\Software\AI\GPT-SoVITS-beta\logs\mangev2\5-wav32k\vocal_vocal_wav103_2t5nyv4dn.wav_10.wav_3780800_3855360.wav 安安稳稳过日子.
D:\Software\AI\GPT-SoVITS-beta\logs\mangev2\5-wav32k\vocal_vocal_wav103_2t5nyv4dn.wav_10.wav_3547200_3686400.wav 何必呢?大好河山处处是好姑娘.
D:\Software\AI\GPT-SoVITS-beta\logs\mangev2\5-wav32k\vocal_vocal_wav103_2t5nyv4dn.wav_10.wav_69440_302080.wav 一
D:\Software\AI\GPT-SoVITS-beta\logs\25325803342\5-wav32k\okvocal_25325803342-allc1k_jmjh.wav_10.wav_320_132800.wav 我要开始充电了,不许乱动
– 降噪处理 训练数据
1
2
3
4
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\uvr5_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav #先HP5得到人声instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav, 再把这个进行VR-DeEchoDeReverb 去回音去噪音得到tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt 训练必须
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\asr_opt\denoise_opt.list 训练必须
— 不降噪处理 训练数据
1
2
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt
D:\Software\AI\GPT-SoVITS-beta\output\asr_opt\slicer_opt.list
1Ba-SoVITS training【Total epochs】. The model is located in SoVITS_weights.
GPT-SoVITS-beta:
训练参数: 1Ba-SoVITS training的 Total epochs 8 ,1Bb-GPT training的Total training epochs 15.
得到SoVITS_weights: tieniu_denoise_e16_s176.pth tieniu_not_denoise_e16_s176.pth
GPT-SoVITS-beta0306fix2:
训练参数: 1Ba-SoVITS training的 Total epochs 25 ,1Bb-GPT training的 Total training epochs 15.
得到SoVITS_weights: tieniu_denoise_e12_s132.pth tieniu_not_denoise_e24_s264.pth
改进:1Bb-GPT training的 Total training epochs 15. 调高还原越精细。 调到24.
– 推理参考音频
1
2
3
4
5
6
7
8
9
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0001533440_0001675200.wav 当你突然变成了那个他最熟悉的陌生人时。
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0001533440_0001675200.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0002169920_0002342080.wav 可能有的姐妹们会担心自己没有舞蹈基础。
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0002169920_0002342080.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0000244480_0000428800.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0000244480_0000428800.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\denoise_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0001047040_0001171200.wav
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\slicer_opt\tieshenrewu-lizhi-new-HP5_only-VR-DeEchoDeReverb.wav_0001047040_0001171200.wav
如果使用 tieniu_not_denoise-e15.ckpt tieniu_not_denoise_e16_s176.pth 但用denoise的参考音频 声音大 。 tieniu_denoise_e12_s132.pth
1
2
3
4
5
6
http://0.0.0.0:9874/
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\uvr5_opt\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav #HP5得到人声 没有去回音去噪音处理
D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5
D:\Software\AI\GPT-SoVITS-beta\output\asr_opt\tieniuv3-hp5.list
训练参数:
1Ba-SoVITS training的 Total epochs 15 ,1Bb-GPT training的Total training epochs 25.
如果报cuda内存错误。
1
orch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 23.99 GiB total capacity; 4.34 GiB already allocated; 17.88 GiB free; 4.49 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
需要重启win11.什么程序不要开启。只运行GPT-SoVITS-beta 网页浏览器edge notepad++ 文件浏览器
问题解决。
推理 声音还可以。
1
2
3
4
5
D:\Software\AI\GPT-SoVITS-beta0306fix2\output\uvr5_opt\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav
D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5
D:\Software\AI\GPT-SoVITS-beta\output\asr_opt\tieniuv3-hp5.list
训练参数:
1Ba-SoVITS training的 Total epochs 15 ,1Bb-GPT training的Total training epochs 48.
1
2
3
4
5
6
D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav_1401600_1533440.wav 一定会给他带来更多的惊喜和好奇。
D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav_2169920_2342080.wav 可能有的姐妹们会担心自己没有舞蹈基础。
D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\tieniuv3-hp5\instrument_tieshenrewu-lizhi-newrr3sie3p.WAV_10.wav_3511680_3679040.wav ....却等于掌握了
tieniuv3-hp5-epochs48 推理声音可以
先 hp5 得到
VR-DeEchoNormal 得到
VR-DeEchoDeReverb 得到
D:\Software\AI\GPT-SoVITS-beta\output\uvr5_opt\如何改善跳舞不自信和自卑-BADA-VR-DeEchoDeReverb.wav
如何改善跳舞不自信和自卑-BADA-VR-DeEchoDeReverb.wav
切片得到
D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\BADA-hp5-VR-DeEchoDeReverb-60毫秒停顿
D:\Software\AI\GPT-SoVITS-beta\output\asr_opt\BADA-VR-DeEchoDeReverb-60毫秒停顿.list
训练名字:BADA-VR-DeEchoDeReverb
1Ba-SoVITS training的 Total epochs 15 ,1Bb-GPT training的Total training epochs 48.
D:\Software\AI\GPT-SoVITS-beta\output\slicer_opt\BADA-hp5-VR-DeEchoDeReverb-60毫秒停顿\如何改善跳舞不自信和自卑-BADA-VR-DeEchoDeReverb.wav_1280_258880.wav |如何改善跳舞不自信自卑以及学习过程中放不开的状态呢?按照这三点去做,你会慢慢遇见那个你喜欢的自己。