Giter Club home page Giter Club logo

Comments (28)

zhuzaileiting avatar zhuzaileiting commented on May 23, 2024

这一步有问题吗
C:\Users\Administrator\Desktop\Realtime-Voice-Clone-Chinese-main\Realtime-Voice-Clone-Chinese-main>python synthesizer_preprocess_audio.py E:\data\aidatatang_200zh
Arguments:
datasets_root: E:\data\aidatatang_200zh
out_dir: E:\data\aidatatang_200zh\SV2TTS\synthesizer
n_processes: None
skip_existing: False
hparams:
no_alignments: False
dataset: aidatatang_200zh

Using data from:
E:\data\aidatatang_200zh\aidatatang_200zh\corpus\train
aidatatang_200zh: 62%|█████████████████████████████████████████████████████████████████████████████▉ | 524/840 [46:39<29:46, 5.65s/speakers]

from mockingbird.

non-one avatar non-one commented on May 23, 2024

这一步有问题吗
C:\Users\Administrator\Desktop\Realtime-Voice-Clone-Chinese-main\Realtime-Voice-Clone-Chinese-main>python synthesizer_preprocess_audio.py E:\data\aidatatang_200zh
Arguments:
datasets_root: E:\data\aidatatang_200zh
out_dir: E:\data\aidatatang_200zh\SV2TTS\synthesizer
n_processes: None
skip_existing: False
hparams:
no_alignments: False
dataset: aidatatang_200zh

Using data from:
E:\data\aidatatang_200zh\aidatatang_200zh\corpus\train
aidatatang_200zh: 62%|█████████████████████████████████████████████████████████████████████████████▉ | 524/840 [46:39<29:46, 5.65s/speakers]

没有,我是直接拿pt放入目录下,没有执行这些命令

from mockingbird.

zhuzaileiting avatar zhuzaileiting commented on May 23, 2024

数据集得加载,下载数据集 http://www.openslr.org/62/

from mockingbird.

zhuzaileiting avatar zhuzaileiting commented on May 23, 2024

通过这些数据集(声音样本)与自己的(目标)样本学习后才能模仿声音

from mockingbird.

non-one avatar non-one commented on May 23, 2024

pt文件的作用是什么呢,怎么使用?
image
按我个人理解,训练步骤的产出是模型文件

from mockingbird.

zhuzaileiting avatar zhuzaileiting commented on May 23, 2024

@楼主解释一下

from mockingbird.

non-one avatar non-one commented on May 23, 2024

image
作者是提供训练后的模型链接的,我显卡不够训练的,所以是直接拿来用的

from mockingbird.

zhuzaileiting avatar zhuzaileiting commented on May 23, 2024

数据集是实体的声音文件样本,训练模型是分析中文优化吧

from mockingbird.

non-one avatar non-one commented on May 23, 2024

好吧,我还以为可以直接使用

from mockingbird.

babysor avatar babysor commented on May 23, 2024

环境

Windows 10
Python 3.7

描述

百度云的pt模型放入synthesizer/saved_models/后,python .\demo_toolbox.py可执行,但产生结果都是杂音,中文和拼音都不太行

问题截图

image
image

本人纯小白,希望大佬有空给予指点。

最新代码的话是可以输入中文的,你用pinyin试过吗?
另外我看了一下图,你的录音输入好像也不太清晰,尽可能在5秒内说清晰2~3句话

from mockingbird.

non-one avatar non-one commented on May 23, 2024

按照B站上演示的视频,我进行了以下尝试:

  • 更换拾音设备。原视频的输入图长得也差不多,应该不是主要原因
  • 更换拼音形式。完全按照视频输入框内容,依然都是滋滋声
    我考虑是直接使用模型的姿势不对,所以有使用百度云上模型文件成功的,请分享下经验,几天后issue我会关闭

from mockingbird.

babysor avatar babysor commented on May 23, 2024

按照B站上演示的视频,我进行了以下尝试:

  • 更换拾音设备。原视频的输入图长得也差不多,应该不是主要原因
  • 更换拼音形式。完全按照视频输入框内容,依然都是滋滋声
    我考虑是直接使用模型的姿势不对,所以有使用百度云上模型文件成功的,请分享下经验,几天后issue我会关闭

貌似找到问题了,图中你应该选择了英文版的synthesizer了,要在synthesizer一项中改为我上传的
image

from mockingbird.

non-one avatar non-one commented on May 23, 2024

这只是我参照原项目修改的文件名,改回原名也一样,很抱歉没说清楚。另外作者你方便出一版如何快速搭建demo的教程吗,让更多人可以直接上手,先不用考虑训练问题

from mockingbird.

babysor avatar babysor commented on May 23, 2024

这只是我参照原项目修改的文件名,改回原名也一样,很抱歉没说清楚。另外作者你方便出一版如何快速搭建demo的教程吗,让更多人可以直接上手,先不用考虑训练问题

目前会逐步优化,不过有蛮多朋友已经跑通了,这里可能有哪步出错了

from mockingbird.

Larryvrh avatar Larryvrh commented on May 23, 2024

Issue
遇到了情况类似的问题,似乎是因为模型尺寸不匹配

from mockingbird.

non-one avatar non-one commented on May 23, 2024

Issue
遇到了情况类似的问题,似乎是因为模型尺寸不匹配

这个是输入框的问题,我也碰到过,对于某些中文或者字符不能很好识别,更换为其他短句试试

from mockingbird.

wanghaisheng avatar wanghaisheng commented on May 23, 2024

按照B站上演示的视频,我进行了以下尝试:

* 更换拾音设备。原视频的输入图长得也差不多,应该不是主要原因

* 更换拼音形式。完全按照视频输入框内容,依然都是滋滋声
  我考虑是直接使用模型的姿势不对,所以有使用百度云上模型文件成功的,请分享下经验,几天后issue我会关闭

我想请教下 这个录音可以用现成的mp3文件吗

from mockingbird.

babysor avatar babysor commented on May 23, 2024

按照B站上演示的视频,我进行了以下尝试:

* 更换拾音设备。原视频的输入图长得也差不多,应该不是主要原因

* 更换拼音形式。完全按照视频输入框内容,依然都是滋滋声
  我考虑是直接使用模型的姿势不对,所以有使用百度云上模型文件成功的,请分享下经验,几天后issue我会关闭

我想请教下 这个录音可以用现成的mp3文件吗

可以的.

Issue
遇到了情况类似的问题,似乎是因为模型尺寸不匹配

这个是输入框的问题,我也碰到过,对于某些中文或者字符不能很好识别,更换为其他短句试试

已经定位到问题,有个朋友正在修复中,你也可以看下,应该是synthesizer里面切割句子除了点问题

from mockingbird.

usagiring avatar usagiring commented on May 23, 2024

我也是使用百度云上的模型,同样是杂音。
11


我自己训练了33k,能出类似声线,但还是杂音,是训练没到位吗?
attention_step_33000_sample_1
step-33000-mel-spectrogram_sample_1

from mockingbird.

miven avatar miven commented on May 23, 2024

LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

from mockingbird.

usagiring avatar usagiring commented on May 23, 2024

LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

这个模型可以的!

from mockingbird.

babysor avatar babysor commented on May 23, 2024

LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

方便分享到readme吗?你可以直接提 路过留痕一下commit 😄

from mockingbird.

miven avatar miven commented on May 23, 2024

LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

方便分享到readme吗?你可以直接提 路过留痕一下commit 😄

可以啊,方便大家测试,您可以直接加到readme中😄

from mockingbird.

non-one avatar non-one commented on May 23, 2024

LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

谢谢大佬给的模型,demo可以跑通了,该issue得到解决,将关闭

from mockingbird.

babysor avatar babysor commented on May 23, 2024

LOSS太高了 训练到0.4以下试试
分享下我训练的模型和效果:
链接:https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ
提取码:2021
训练效果视频
https://www.bilibili.com/video/BV1uh411B7AD/

方便分享到readme吗?你可以直接提 路过留痕一下commit 😄

可以啊,方便大家测试,您可以直接加到readme中😄
提交啦还顺便@你了哈

from mockingbird.

576272658 avatar 576272658 commented on May 23, 2024

我也使用的miven大佬提供的模型,但是和你一样的问题,出来是杂音不知道是什么原因,加载encoder也很慢

from mockingbird.

babysor avatar babysor commented on May 23, 2024

我也使用的miven大佬提供的模型,但是和你一样的问题,出来是杂音不知道是什么原因,加载encoder也很慢

参考置顶的issue哈

from mockingbird.

zhenqicai avatar zhenqicai commented on May 23, 2024

环境

Windows 8.1 Python 3.7.9

描述

你好,运行 demo_toolbox.py 出现以下错误是什么原因呢?

问题截图

image
image
image

from mockingbird.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.