is this better than diff svc and so vit svc?

Question

I would like to know if this is better than diff svc and so vit svc

hongwen-sun · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

MaxMax2016 · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

hongwen-sun · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

nshmyrev · Answer

Btw, there is argumentation behind this that whisper was actually trained on songs. It

MaxMax2016 · Answer

whisper is from openai .

loboere · Answer

mm.. does that mean it's better?

MaxMax2016 · Answer

from now on, whisper is the best audio encoder for svc.这个项目的目的就是为了去证明这一点。

hongwen-sun · Answer

from now on, whisper is the best audio encoder for svc.这个项目的目的就是为了去证明这一点。

MaxMax2016 · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

MaxMax2016 · Answer

此外，我个人比较崇尚简洁。您如何看待 ‘奥卡姆剃刀原理’ 呢？

hongwen-sun · Answer

我感觉简洁也可以达到比较好的效果，并不冲突，效果的差距通过block结构的简单修改和参数量的增加完全可以弥补。
另外，如果验证有效性，我理解还是需要对比不同cont

hongwen-sun · Answer

说白了，我本来是想白嫖您的结论，看看如果您做了对比，哪个好一点

MaxMax2016 · Answer

whisper是目前为止能获取到的效果最好的多语言ASR模型，它的好坏由他的识别率就可以直接体现，它通过海量的多语言数据训练得到，这是其他开源模型无法媲美的。如果您要做语音

hongwen-sun · Answer

好的，非常感谢。
对于转换而言，whisper也不一定就比不过自监督模型，更可能的情况是这些模型都有自身的缺点，需要针对vc任务有专门的设计。

is this better than diff svc and so vit svc? about lora-svc HOT 14 OPEN