使用 Python 将语音转换为文本
介绍
在本文中,我将演示如何使用 Python 将语音转换为文本。这一切都是在“语音识别”API 和“PyAudio”库的帮助下完成的。首先,我将解释“PyAudio”和“语音识别”。
关于“语音识别”API
语音识别 API 可用作在线和离线 API(应用程序编程接口)。它有助于连接任何服务,例如谷歌翻译,以将语音转换为文本。
关于“PyAudio”库
这个 Python 库用于通过麦克风和扬声器进行音频输入/输出操作。这将有助于让我们的声音通过麦克风。
开发的必备条件
硬件要求
-
麦克风
软件要求
-
Python 3.7.3(已安装在您的系统中)
-
PyAudio 库(本文附带下载资源)
第1步
在命令提示符中执行以下命令以在 Python 中安装“语音识别”API。在安装之前,您将验证您的 Python 版本,即“Python 3.7.3”
pip install SpeechRecognition
第2步
接下来,我们可以安装“PyAudio”库。您可以按照以下步骤安装此库。
- 下载 PyAudio 文件(本文将附上文件)。
- 打开 PowerShell 并设置文件下载文件夹的路径。
- 在 PowerShell 中执行以下命令
pip install PyAudio-0.2.11-cp37-cp37m-win_amd64.whl
第 3 步
从 Windows 菜单打开 Python 3.7.3 IDLE(64 位)。
第四步
将以下代码复制并保存在 Python IDLE 3.7.3 中。
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
print("Speak Anything :")
audio = r.listen(source)
try:
text = r.recognize_google(audio)
print("You said : {}".format(text))
except:
print("Sorry could not recognize what you said")
第 5 步
将麦克风插入 PC/笔记本电脑音频插孔。
第 6 步
按键盘上的“F5”键运行 Python 代码(或)选择“运行”“运行模块”。
第 7 步
准备好聆听您的声音,使用麦克风说一些话,识别后,转换后的文本将显示在您的终端窗口中。
总结
最后,我们已经成功地使用 Python 将语音转换为文本。
常见问题FAQ
- 程序仅供学习研究,请勿用于非法用途,不得违反国家法律,否则后果自负,一切法律责任与本站无关。
- 请仔细阅读以上条款再购买,拍下即代表同意条款并遵守约定,谢谢大家支持理解!