Comments (6)
有以下疑问请大佬们解答: 已整理了3个角色干声,每个角色大概1万多条语音,每条在2-13秒以内。 batch_size: 4,learning_rate: 0.0001,3060Laptop(6G),内存24G。 1、多角色一起训练好?还是单独每个角色训练比较好? 2、有必要每个角色都放1万多条语音数据进行训练吗?是数据多好?还是训练次数多好? 3、Epoch: per cost 236.25s,如果一起训练3个角色,给予足够时间,3万多条语音都会跑训一遍? 4、如果前期只使用小量干声数据,后期可以增加干声数据继续训练吗,如何操作稳妥? 5、如果一开始就进行单角色训练,后期就不能增加角色了吗,只能单独再训练一个模型?
感谢大佬!
- 数据集足够多的时候单角色多角色模型区别不大
- 多点没事,可以比较有效的防止过拟合
- 一个epoch就是走完了一遍整个数据集
- 不建议中途更改数据集
- 在
config.json
中,n_speakers决定了模型的最大说话人数,n_speakers需要大于1才能在之后继续增加说话人
from so-vits-svc.
。。。。。
- 不建议中途更改数据集
- 在
config.json
中,n_speakers决定了模型的最大说话人数,n_speakers需要大于1才能在之后继续增加说话人
@Miuzarte 感谢大佬的热心回复!很详细,疑惑终于有了专业的解答,十分感谢!!!
1、根据您回复的第4、5条内容,我计划以下操作方法是否正确:
新建5个speakers,其中只有一个放专人的语音素材,另外4个是空白文件夹。等第一个speakers训练完成,后面再逐个增加对应的语音素材进行别的角色训练,可否?
2、目前我使用4.0版本,建立了3个角色同时训练,每个500条10秒左右语音(朗读干声无杂音),已进行:Epoch: 478,ep: 177400,但是推理出来有电音。是因为训练次数不足、500条语音素材太少、还是版本的问题呢?如果是使用SOVITS4.0V2版本会不会有改善?
from so-vits-svc.
。。。。。
- 不建议中途更改数据集
- 在
config.json
中,n_speakers决定了模型的最大说话人数,n_speakers需要大于1才能在之后继续增加说话人@Miuzarte 感谢大佬的热心回复!很详细,疑惑终于有了专业的解答,十分感谢!!!
1、根据您回复的第4、5条内容,我计划以下操作方法是否正确: 新建5个speakers,其中只有一个放专人的语音素材,另外4个是空白文件夹。等第一个speakers训练完成,后面再逐个增加对应的语音素材进行别的角色训练,可否?
2、目前我使用4.0版本,建立了3个角色同时训练,每个500条10秒左右语音(朗读干声无杂音),已进行:Epoch: 478,ep: 177400,但是推理出来有电音。是因为训练次数不足、500条语音素材太少、还是版本的问题呢?如果是使用SOVITS4.0V2版本会不会有改善?
后期添加speaker的具体流程我不太清楚,也许在划分完数据集生成了配置之后会需要手动修改config.json之类的操作
朗读干声无杂音的数据可以考虑一下隔壁diff-svc(原版diff-svc或openvpi团队维护的魔改版),sovits因为各种不能说的原因导致目前没有官方底模可用,出来的效果很一般,训练久了还容易过拟合
from so-vits-svc.
。。。。。
- 不建议中途更改数据集
- 在
config.json
中,n_speakers决定了模型的最大说话人数,n_speakers需要大于1才能在之后继续增加说话人@Miuzarte 感谢大佬的热心回复!很详细,疑惑终于有了专业的解答,十分感谢!!!
1、根据您回复的第4、5条内容,我计划以下操作方法是否正确: 新建5个speakers,其中只有一个放专人的语音素材,另外4个是空白文件夹。等第一个speakers训练完成,后面再逐个增加对应的语音素材进行别的角色训练,可否?
2、目前我使用4.0版本,建立了3个角色同时训练,每个500条10秒左右语音(朗读干声无杂音),已进行:Epoch: 478,ep: 177400,但是推理出来有电音。是因为训练次数不足、500条语音素材太少、还是版本的问题呢?如果是使用SOVITS4.0V2版本会不会有改善?后期添加speaker的具体流程我不太清楚,也许在划分完数据集生成了配置之后会需要手动修改config.json之类的操作
朗读干声无杂音的数据可以考虑一下隔壁diff-svc(原版diff-svc或openvpi团队维护的魔改版),sovits因为各种不能说的原因导致目前没有官方底模可用,出来的效果很一般,训练久了还容易过拟合
明白了,感谢大佬指明方向!
from so-vits-svc.
个人观察, 电音会逐渐减小, 直到 28w 步左右会消失 (加上了 M4Singer 数据集).
from so-vits-svc.
请教 @Miuzarte ,手里只有20-30条语音文本,请问有比较好的few-shot-tts项目可以用来训练模型,然后再生成更多的语音来训练svc么,或者当前项目能支持few-shot训练么,用户场景真正的语音数据确实比较少,所以来请教一下,谢谢
from so-vits-svc.
Related Issues (20)
- ValueError: math domain error
- [mps] issue with Apple silicon compatibility HOT 1
- [Help]: 特征检索在webui推理中无法使用 HOT 8
- [Help] Where to download the latest weight? error, emb_g.weight is not in the checkpoint HOT 2
- [Help]: subprocess-exited-with-error HOT 1
- [Bug]: KL散度为负数 HOT 3
- [Bug]: ERROR: Failed building wheel for pyworld on Google Colab HOT 3
- issue about speaker embedding
- dlopen: cannot load any more object with static TLS HOT 1
- [Bug]: HOT 2
- [Bug]:ERROR: During reasoning, the final result cannot be output
- [Bug]: ValueError: array is not C-contiguous When using feature_retrieval 使用特征检索时报错 HOT 1
- [Help]: 是否有支持VITS模型ONNX的计划? HOT 1
- [Help]: 为何扩散模型生成的效果要远好於 sovits 的模型? HOT 3
- [Bug]: new Shallow diffusion bug? HOT 3
- [Bug]: Package conflict with numpy
- [Help]: OOM error on 24 GB GPU upon inference HOT 1
- [Bug]: 4.0下如果数据集过多生成F0会导致爆显存 HOT 10
- [Help]: 如何使用自己的预训练模型 HOT 2
- [Bug]: 中文文件名会出现编码错误 HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from so-vits-svc.