存在问题:
将音频转化成文字进行输出
解决方案:
调用第三方百度的语音识别api进行语音识别
步骤:
1)安装百度提供的Python库:pip install baidu-aip
2)运行以下代码:
from aip import AipSpeechAPP_ID = '160'API_KEY = 'f6XVtm'SECRET_KEY = 'zbvyYC'# 百度AI库获取的参数client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 构造读取语音文件函数def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()# 识别本地文件 主函数result = client.asr(get_file_content(r'F:\PythonFiles\PycharmFile\16k.pcm'), 'pcm', 16000, { 'lan': 'zh',})#此处地址处必须要加r,使其成为绝对地址,要么容易字符转义出现错误print(result)
注:
1)百度AI云平台地址:/
2)进入后添加应用,获取相应的接口ID和密钥(上文提到的三个参数)
3)该接口只支持pcm、wav和amr格式音频
4)程序返回值有4个,如下
5)存在一个问题,自己录的音总是报3301错误,该错误显示录音效果差,无论怎么录音都显示这个错误