- 本项目通过PyCharm+Qt开发,顺利完成了预期所有内容,包括语音识别,语音合成,机器翻译,性别分析,中英句子分析,以及扩展功能--语音翻译(且语音翻译不只能进行中译英,还能进行其他语种和中文之间的互译)
-
- 语音识别按钮的使用是点击后弹出文件选择框,这时候框的左上角会有相应提示,按照提示选择相应的音频文件即可完成语音识别。另如果不选择任何文件直接关闭的话,主界面的结果显示框会显示相应提示,这体现了本程序的健壮性。
-
- 语音合成按钮的使用是先在结果显示框输入要合成的内容,然后在选择好对应的参数(语速和发言人)后点击语音合成即可在对应目录下生成pcm音频文件,然后再点击打开语音合成输出目录即可打开相应目录查看。且如果不输入任何内容直接点语音合成会在结果显示框有相应提示,不会崩溃,这体现了本程序的健壮性。
-
- 机器翻译按钮的使用是在选择完源语种和目标语种后在源语种所对输入框输入想要翻译的内容,然后点击翻译,即可在目标语种对应显示框中看到翻译结果。且如果什么也不输入直接点击翻译的话也会在结果显示框给出相应提示,不会崩溃。体现了本程序的健壮性。
-
- 性别分析按钮的使用是直接点击性别分析按钮弹出文件选择框,选择相应音频文件进行分析,返回的结果会显示在结果显示框。同样如果不选择任何文件直接关闭的话,主界面的结果显示框会显示相应提示,这体现了本程序的健壮性。
-
- 中英句子分析按钮的使用是先在结果框里输入标准文本,然后选择对应参数(语种和年龄段),点击按钮进行相应音频的选择。返回的分析结果会显示在结果框内。如果不选择任何文件直接关闭的话,主界面的结果显示框会显示相应提示,这体现了本程序的健壮性。
-
- 语音翻译的使用是选择参数(源语种,目标语种,翻译发言人)后按下按钮等待约一秒钟(等待系统调用麦克风设备),然后说出想要翻译的话说完之后松开按钮等待翻译完成。翻译的结果会显示在结果框内,同时在对应目录下会生成音频文件,单击打开同声传译文件目录即可打开对应目录查看。如果在录制过程中什么也不说的话会提示没有接收到声音,不会导致崩溃,体现了程序的健壮性。
-
本程序用到了音视频处理程序 ffmpeg ,如果机器中没有配置相应的环境变量是无法正常使用语音翻译的,相应的包已经随程序打入工程目录下,只需要自己配置一下环境变量到bin目录下即可,具体说明在视频内有演示。 视频请移步B站:https://www.bilibili.com/video/BV1xt4y1N7o4/?spm_id_from=333.999.0.0
-
本项目完整工程文件在当前目录的压缩包里,该工程只包含了2_0版本,但是也留有初版的同声传译API的代码。