Light

lyqzhz / liyanqing Goto Github PK

View Code? Open in Web Editor NEW

0.0 1.0 0.0 5.36 MB

基于科大讯飞的语音处理

Python 100.00%

liyanqing's Introduction

liyanqing

基于科大讯飞平台的语音处理项目

------啥也不会的李岩青

一. 项目总览

本项目通过PyCharm+Qt开发，顺利完成了预期所有内容，包括语音识别，语音合成，机器翻译，性别分析，中英句子分析，以及扩展功能--语音翻译（且语音翻译不只能进行中译英，还能进行其他语种和中文之间的互译）

二.功能分述

语音识别（音转字）
- 语音识别按钮的使用是点击后弹出文件选择框，这时候框的左上角会有相应提示，按照提示选择相应的音频文件即可完成语音识别。另如果不选择任何文件直接关闭的话，主界面的结果显示框会显示相应提示，这体现了本程序的健壮性。
语音合成（字转音）
- 语音合成按钮的使用是先在结果显示框输入要合成的内容，然后在选择好对应的参数（语速和发言人）后点击语音合成即可在对应目录下生成pcm音频文件，然后再点击打开语音合成输出目录即可打开相应目录查看。且如果不输入任何内容直接点语音合成会在结果显示框有相应提示，不会崩溃，这体现了本程序的健壮性。
机器翻译
- 机器翻译按钮的使用是在选择完源语种和目标语种后在源语种所对输入框输入想要翻译的内容，然后点击翻译，即可在目标语种对应显示框中看到翻译结果。且如果什么也不输入直接点击翻译的话也会在结果显示框给出相应提示，不会崩溃。体现了本程序的健壮性。
性别分析
- 性别分析按钮的使用是直接点击性别分析按钮弹出文件选择框，选择相应音频文件进行分析，返回的结果会显示在结果显示框。同样如果不选择任何文件直接关闭的话，主界面的结果显示框会显示相应提示，这体现了本程序的健壮性。
中英句子分析
- 中英句子分析按钮的使用是先在结果框里输入标准文本，然后选择对应参数（语种和年龄段），点击按钮进行相应音频的选择。返回的分析结果会显示在结果框内。如果不选择任何文件直接关闭的话，主界面的结果显示框会显示相应提示，这体现了本程序的健壮性。
语音翻译（同声传译）
- 语音翻译的使用是选择参数（源语种，目标语种，翻译发言人）后按下按钮等待约一秒钟（等待系统调用麦克风设备），然后说出想要翻译的话说完之后松开按钮等待翻译完成。翻译的结果会显示在结果框内，同时在对应目录下会生成音频文件，单击打开同声传译文件目录即可打开对应目录查看。如果在录制过程中什么也不说的话会提示没有接收到声音，不会导致崩溃，体现了程序的健壮性。

三.其他说明

本程序用到了音视频处理程序 ffmpeg ，如果机器中没有配置相应的环境变量是无法正常使用语音翻译的，相应的包已经随程序打入工程目录下，只需要自己配置一下环境变量到bin目录下即可，具体说明在视频内有演示。视频请移步B站：https://www.bilibili.com/video/BV1xt4y1N7o4/?spm_id_from=333.999.0.0
本项目完整工程文件在当前目录的压缩包里，该工程只包含了2_0版本，但是也留有初版的同声传译API的代码。

liyanqing's People

Contributors

Watchers

Recommend Projects

React

A declarative, efficient, and flexible JavaScript library for building user interfaces.
Vue.js

🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
Typescript

TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
TensorFlow

An Open Source Machine Learning Framework for Everyone
Django

The Web framework for perfectionists with deadlines.
Laravel

A PHP framework for web artisans
D3

Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

javascript

JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
web

Some thing interesting about web. New door for the world.
server

A server is a program made to process requests and deliver data to clients.
Machine learning

Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Visualization

Some thing interesting about visualization, use data art
Game

Some thing interesting about game, make everyone happy.

Recommend Org

Facebook

We are working to build community through open source technology. NB: members must have two-factor auth.
Microsoft

Open source projects and samples from Microsoft.
Google

Google ❤️ Open Source for everyone.
Alibaba

Alibaba Open Source for everyone
D3

Data-Driven Documents codes.
Tencent

China tencent open source team.