基于vosk的本地轻量化语音识别程序
- 本地运行:所有处理都在本地完成,无需网络连接,保护用户隐私。
- 轻量化:程序体积小,占用资源少,适合各种计算环境。
- 简单易用:通过图形界面操作,一键录音并转换为文本。
- 高识别率:使用vosk模型,提供准确的语音识别效果。
- Python 3.x
- pyaudio
- vosk
- numpy
- 确保系统已安装Python 3.x。
- 安装所需的Python库:
pip install pyaudio vosk numpy
- 下载vosk模型文件并放置在程序指定的路径下。
- 运行程序,界面会提示“点击右侧按钮开始录音”。
- 点击“点击录音”按钮开始录音。
- 录音过程中保持安静2秒后,程序会自动结束录音并开始转换。
- 转换完成后,文本会自动显示在下方的文本框中。
- 录音时,请确保环境安静,以提高识别准确率。
- 如果录音转文字失败,请检查模型文件路径是否正确,并尝试重新录音。
speech_to_text
:核心函数,负责录音和语音识别。notice
:用于在状态框中显示信息。run
:启动录音和识别的线程。root.mainloop
:Tkinter的事件循环,等待用户操作。
欢迎对本项目提出改进建议或贡献代码。如有问题,请通过Issues进行反馈。
本项目遵循MIT License,详情见项目中的LICENSE
文件。