Comments (28)
这一步有问题吗
C:\Users\Administrator\Desktop\Realtime-Voice-Clone-Chinese-main\Realtime-Voice-Clone-Chinese-main>python synthesizer_preprocess_audio.py E:\data\aidatatang_200zh
Arguments:
datasets_root: E:\data\aidatatang_200zh
out_dir: E:\data\aidatatang_200zh\SV2TTS\synthesizer
n_processes: None
skip_existing: False
hparams:
no_alignments: False
dataset: aidatatang_200zh
Using data from:
E:\data\aidatatang_200zh\aidatatang_200zh\corpus\train
aidatatang_200zh: 62%|█████████████████████████████████████████████████████████████████████████████▉ | 524/840 [46:39<29:46, 5.65s/speakers]
from mockingbird.
这一步有问题吗
C:\Users\Administrator\Desktop\Realtime-Voice-Clone-Chinese-main\Realtime-Voice-Clone-Chinese-main>python synthesizer_preprocess_audio.py E:\data\aidatatang_200zh
Arguments:
datasets_root: E:\data\aidatatang_200zh
out_dir: E:\data\aidatatang_200zh\SV2TTS\synthesizer
n_processes: None
skip_existing: False
hparams:
no_alignments: False
dataset: aidatatang_200zhUsing data from:
E:\data\aidatatang_200zh\aidatatang_200zh\corpus\train
aidatatang_200zh: 62%|█████████████████████████████████████████████████████████████████████████████▉ | 524/840 [46:39<29:46, 5.65s/speakers]
没有,我是直接拿pt放入目录下,没有执行这些命令
from mockingbird.
数据集得加载,下载数据集 http://www.openslr.org/62/
from mockingbird.
通过这些数据集(声音样本)与自己的(目标)样本学习后才能模仿声音
from mockingbird.
pt文件的作用是什么呢,怎么使用?
按我个人理解,训练步骤的产出是模型文件
from mockingbird.
@楼主解释一下
from mockingbird.
作者是提供训练后的模型链接的,我显卡不够训练的,所以是直接拿来用的
from mockingbird.
数据集是实体的声音文件样本,训练模型是分析中文优化吧
from mockingbird.
好吧,我还以为可以直接使用
from mockingbird.
环境
Windows 10
Python 3.7描述
百度云的pt模型放入
synthesizer/saved_models/
后,python .\demo_toolbox.py
可执行,但产生结果都是杂音,中文和拼音都不太行问题截图
本人纯小白,希望大佬有空给予指点。
最新代码的话是可以输入中文的,你用pinyin试过吗?
另外我看了一下图,你的录音输入好像也不太清晰,尽可能在5秒内说清晰2~3句话
from mockingbird.
按照B站上演示的视频,我进行了以下尝试:
- 更换拾音设备。原视频的输入图长得也差不多,应该不是主要原因
- 更换拼音形式。完全按照视频输入框内容,依然都是滋滋声
我考虑是直接使用模型的姿势不对,所以有使用百度云上模型文件成功的,请分享下经验,几天后issue我会关闭
from mockingbird.
按照B站上演示的视频,我进行了以下尝试:
- 更换拾音设备。原视频的输入图长得也差不多,应该不是主要原因
- 更换拼音形式。完全按照视频输入框内容,依然都是滋滋声
我考虑是直接使用模型的姿势不对,所以有使用百度云上模型文件成功的,请分享下经验,几天后issue我会关闭
貌似找到问题了,图中你应该选择了英文版的synthesizer了,要在synthesizer
一项中改为我上传的
from mockingbird.
这只是我参照原项目修改的文件名,改回原名也一样,很抱歉没说清楚。另外作者你方便出一版如何快速搭建demo的教程吗,让更多人可以直接上手,先不用考虑训练问题
from mockingbird.
这只是我参照原项目修改的文件名,改回原名也一样,很抱歉没说清楚。另外作者你方便出一版如何快速搭建demo的教程吗,让更多人可以直接上手,先不用考虑训练问题
目前会逐步优化,不过有蛮多朋友已经跑通了,这里可能有哪步出错了
from mockingbird.
from mockingbird.
这个是输入框的问题,我也碰到过,对于某些中文或者字符不能很好识别,更换为其他短句试试
from mockingbird.
按照B站上演示的视频,我进行了以下尝试:
* 更换拾音设备。原视频的输入图长得也差不多,应该不是主要原因 * 更换拼音形式。完全按照视频输入框内容,依然都是滋滋声 我考虑是直接使用模型的姿势不对,所以有使用百度云上模型文件成功的,请分享下经验,几天后issue我会关闭
我想请教下 这个录音可以用现成的mp3文件吗
from mockingbird.
按照B站上演示的视频,我进行了以下尝试:
* 更换拾音设备。原视频的输入图长得也差不多,应该不是主要原因 * 更换拼音形式。完全按照视频输入框内容,依然都是滋滋声 我考虑是直接使用模型的姿势不对,所以有使用百度云上模型文件成功的,请分享下经验,几天后issue我会关闭
我想请教下 这个录音可以用现成的mp3文件吗
可以的.
这个是输入框的问题,我也碰到过,对于某些中文或者字符不能很好识别,更换为其他短句试试
已经定位到问题,有个朋友正在修复中,你也可以看下,应该是synthesizer里面切割句子除了点问题
from mockingbird.
我自己训练了33k,能出类似声线,但还是杂音,是训练没到位吗?
from mockingbird.
LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/
from mockingbird.
LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/
这个模型可以的!
from mockingbird.
LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/
方便分享到readme吗?你可以直接提 路过留痕一下commit 😄
from mockingbird.
LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/方便分享到readme吗?你可以直接提 路过留痕一下commit 😄
可以啊,方便大家测试,您可以直接加到readme中😄
from mockingbird.
LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/
谢谢大佬给的模型,demo可以跑通了,该issue得到解决,将关闭
from mockingbird.
LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/方便分享到readme吗?你可以直接提 路过留痕一下commit 😄
可以啊,方便大家测试,您可以直接加到readme中😄
提交啦还顺便@你了哈
from mockingbird.
我也使用的miven大佬提供的模型,但是和你一样的问题,出来是杂音不知道是什么原因,加载encoder也很慢
from mockingbird.
我也使用的miven大佬提供的模型,但是和你一样的问题,出来是杂音不知道是什么原因,加载encoder也很慢
参考置顶的issue哈
from mockingbird.
环境
Windows 8.1 Python 3.7.9
描述
你好,运行 demo_toolbox.py 出现以下错误是什么原因呢?
问题截图
from mockingbird.
Related Issues (20)
- linux 预处理pre.py报错 找不到npy文件 HOT 4
- tag v0.0.1运行web.py错误(小白向) HOT 1
- ModuleNotFoundError: No module named 'flask.scaffold'
- 最新的交流群或者discord社区有没有
- 有沒有 MockingBird Discord 交流群?
- MockingBird 有雲端操作嗎?
- 自定义音频效果不佳 HOT 1
- After entering this command, an error occurred: pip install -r requirements.txt
- 主要粤语训练,怎样添加MozillaCommonVoice数据集训练?
- 求个好心人给一个MockingBird的交流群,另外tag0.0.1版本下,运行demo_toolbox工具箱,数据集\train无法识别
- windows11输入>python demo_toolbox.py后没反应,不报错 HOT 1
- Docker compose run failed
- 运行 python .\pre.py G:\AISHELL-3 preprocess_audio.py预处理报错,要在transformers里边导包,可是没有这个文件夹啊
- 预处理数据集出现如下错误
- 维度问题
- 没有_sources.txt这个文件'
- 不想每一条语音都覆盖前一条
- 有可以朗读英文和数字的模型吗 HOT 1
- how to solve this problem about pydantic V2? 跑代码在运行web.py时说pydantic版本不对,我使用liunx系统下跑的 HOT 1
- the first pretrained model url in the list cannot be opened
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from mockingbird.