使用百度云上的模型，训练播放后都是杂音 about mockingbird HOT 28 CLOSED

babysor commented on May 23, 2024

使用百度云上的模型，训练播放后都是杂音

from mockingbird.

Comments (28)

zhuzaileiting commented on May 23, 2024

这一步有问题吗
C:\Users\Administrator\Desktop\Realtime-Voice-Clone-Chinese-main\Realtime-Voice-Clone-Chinese-main>python synthesizer_preprocess_audio.py E:\data\aidatatang_200zh
Arguments:
datasets_root: E:\data\aidatatang_200zh
out_dir: E:\data\aidatatang_200zh\SV2TTS\synthesizer
n_processes: None
skip_existing: False
hparams:
no_alignments: False
dataset: aidatatang_200zh

Using data from:
E:\data\aidatatang_200zh\aidatatang_200zh\corpus\train
aidatatang_200zh: 62%|█████████████████████████████████████████████████████████████████████████████▉ | 524/840 [46:39<29:46, 5.65s/speakers]

from mockingbird.

non-one commented on May 23, 2024

这一步有问题吗
C:\Users\Administrator\Desktop\Realtime-Voice-Clone-Chinese-main\Realtime-Voice-Clone-Chinese-main>python synthesizer_preprocess_audio.py E:\data\aidatatang_200zh
Arguments:
datasets_root: E:\data\aidatatang_200zh
out_dir: E:\data\aidatatang_200zh\SV2TTS\synthesizer
n_processes: None
skip_existing: False
hparams:
no_alignments: False
dataset: aidatatang_200zh

Using data from:
E:\data\aidatatang_200zh\aidatatang_200zh\corpus\train
aidatatang_200zh: 62%|█████████████████████████████████████████████████████████████████████████████▉ | 524/840 [46:39<29:46, 5.65s/speakers]

没有，我是直接拿pt放入目录下，没有执行这些命令

from mockingbird.

zhuzaileiting commented on May 23, 2024

数据集得加载，下载数据集 http://www.openslr.org/62/

from mockingbird.

zhuzaileiting commented on May 23, 2024

通过这些数据集（声音样本）与自己的（目标）样本学习后才能模仿声音

from mockingbird.

non-one commented on May 23, 2024

pt文件的作用是什么呢，怎么使用？

按我个人理解，训练步骤的产出是模型文件

from mockingbird.

zhuzaileiting commented on May 23, 2024

@楼主解释一下

from mockingbird.

non-one commented on May 23, 2024

作者是提供训练后的模型链接的，我显卡不够训练的，所以是直接拿来用的

from mockingbird.

zhuzaileiting commented on May 23, 2024

数据集是实体的声音文件样本，训练模型是分析中文优化吧

from mockingbird.

non-one commented on May 23, 2024

好吧，我还以为可以直接使用

from mockingbird.

babysor commented on May 23, 2024

环境

Windows 10
Python 3.7

描述

百度云的pt模型放入synthesizer/saved_models/后，python .\demo_toolbox.py可执行，但产生结果都是杂音，中文和拼音都不太行

问题截图



本人纯小白，希望大佬有空给予指点。

最新代码的话是可以输入中文的,你用pinyin试过吗?
另外我看了一下图,你的录音输入好像也不太清晰,尽可能在5秒内说清晰2~3句话

from mockingbird.

non-one commented on May 23, 2024

按照B站上演示的视频，我进行了以下尝试：

更换拾音设备。原视频的输入图长得也差不多，应该不是主要原因
更换拼音形式。完全按照视频输入框内容，依然都是滋滋声
我考虑是直接使用模型的姿势不对，所以有使用百度云上模型文件成功的，请分享下经验，几天后issue我会关闭

from mockingbird.

babysor commented on May 23, 2024

按照B站上演示的视频，我进行了以下尝试：

更换拾音设备。原视频的输入图长得也差不多，应该不是主要原因

更换拼音形式。完全按照视频输入框内容，依然都是滋滋声
我考虑是直接使用模型的姿势不对，所以有使用百度云上模型文件成功的，请分享下经验，几天后issue我会关闭

貌似找到问题了，图中你应该选择了英文版的synthesizer了，要在synthesizer一项中改为我上传的

from mockingbird.

non-one commented on May 23, 2024

这只是我参照原项目修改的文件名，改回原名也一样，很抱歉没说清楚。另外作者你方便出一版如何快速搭建demo的教程吗，让更多人可以直接上手，先不用考虑训练问题

from mockingbird.

babysor commented on May 23, 2024

这只是我参照原项目修改的文件名，改回原名也一样，很抱歉没说清楚。另外作者你方便出一版如何快速搭建demo的教程吗，让更多人可以直接上手，先不用考虑训练问题

目前会逐步优化，不过有蛮多朋友已经跑通了，这里可能有哪步出错了

from mockingbird.

Larryvrh commented on May 23, 2024

遇到了情况类似的问题，似乎是因为模型尺寸不匹配

from mockingbird.

non-one commented on May 23, 2024

遇到了情况类似的问题，似乎是因为模型尺寸不匹配

这个是输入框的问题，我也碰到过，对于某些中文或者字符不能很好识别，更换为其他短句试试

from mockingbird.

wanghaisheng commented on May 23, 2024

按照B站上演示的视频，我进行了以下尝试：

* 更换拾音设备。原视频的输入图长得也差不多，应该不是主要原因

* 更换拼音形式。完全按照视频输入框内容，依然都是滋滋声
  我考虑是直接使用模型的姿势不对，所以有使用百度云上模型文件成功的，请分享下经验，几天后issue我会关闭

我想请教下这个录音可以用现成的mp3文件吗

from mockingbird.

babysor commented on May 23, 2024

按照B站上演示的视频，我进行了以下尝试：

* 更换拾音设备。原视频的输入图长得也差不多，应该不是主要原因

* 更换拼音形式。完全按照视频输入框内容，依然都是滋滋声
  我考虑是直接使用模型的姿势不对，所以有使用百度云上模型文件成功的，请分享下经验，几天后issue我会关闭

我想请教下这个录音可以用现成的mp3文件吗

可以的.

遇到了情况类似的问题，似乎是因为模型尺寸不匹配

这个是输入框的问题，我也碰到过，对于某些中文或者字符不能很好识别，更换为其他短句试试

已经定位到问题,有个朋友正在修复中,你也可以看下,应该是synthesizer里面切割句子除了点问题

from mockingbird.

usagiring commented on May 23, 2024

我也是使用百度云上的模型，同样是杂音。

我自己训练了33k，能出类似声线，但还是杂音，是训练没到位吗？

from mockingbird.

miven commented on May 23, 2024

LOSS太高了训练到0.4以下试试
分享下我训练的模型和效果：
链接：https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码：2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

from mockingbird.

usagiring commented on May 23, 2024

LOSS太高了训练到0.4以下试试
分享下我训练的模型和效果：
链接：https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码：2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

这个模型可以的！

from mockingbird.

babysor commented on May 23, 2024

LOSS太高了训练到0.4以下试试
分享下我训练的模型和效果：
链接：https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码：2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

方便分享到readme吗？你可以直接提路过留痕一下commit 😄

from mockingbird.

miven commented on May 23, 2024

LOSS太高了训练到0.4以下试试
分享下我训练的模型和效果：
链接：https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码：2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

方便分享到readme吗？你可以直接提路过留痕一下commit 😄

可以啊，方便大家测试，您可以直接加到readme中😄

from mockingbird.

non-one commented on May 23, 2024

LOSS太高了训练到0.4以下试试
分享下我训练的模型和效果：
链接：https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码：2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

谢谢大佬给的模型，demo可以跑通了，该issue得到解决，将关闭

from mockingbird.

babysor commented on May 23, 2024

LOSS太高了训练到0.4以下试试
分享下我训练的模型和效果：
链接：https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码：2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

方便分享到readme吗？你可以直接提路过留痕一下commit 😄

可以啊，方便大家测试，您可以直接加到readme中😄
提交啦还顺便@你了哈

from mockingbird.

576272658 commented on May 23, 2024

我也使用的miven大佬提供的模型，但是和你一样的问题，出来是杂音不知道是什么原因，加载encoder也很慢

from mockingbird.

babysor commented on May 23, 2024

我也使用的miven大佬提供的模型，但是和你一样的问题，出来是杂音不知道是什么原因，加载encoder也很慢

参考置顶的issue哈

from mockingbird.

zhenqicai commented on May 23, 2024

环境

Windows 8.1 Python 3.7.9

描述

你好，运行 demo_toolbox.py 出现以下错误是什么原因呢？

问题截图

from mockingbird.

使用百度云上的模型，训练播放后都是杂音 about mockingbird HOT 28 CLOSED

Comments (28)

环境

描述

问题截图

环境

描述

问题截图

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent