请问博主,为什么不同的数据集训练效果差异很大;用的checkpoint-zh_0.pt+vocoder.pt,数据集有原神语音包、cosyvoice生成的音频数据、开源数据集,但是只有原神语音包训后的效果停顿相对自然
请问博主,为什么不同的数据集训练效果差异很大;用的checkpoint-zh_0.pt+vocoder.pt,数据集有原神语音包、cosyvoice生成的音频数据、开源数据集,但是只有原神语音包训后的效果停顿相对自然