先下载python用SDK,可以用python setup.py install安装
# 引入Speech SDKfrom aip import AipSpeech# 定义常量APP_ID = '你的 App ID'API_KEY = '你的 API Key'SECRET_KEY = '你的 Secret Key'# 初始化AipSpeech对象aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
1
2
3
4
5
6
7
8
9
10
在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。
开始识别
注意:
请求说明:
1. 原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
2. 压缩格式支持:pcm(不压缩)、wav、amr
3. 系统支持语言种类:中文(zh)、粤语(ct)、英文(en)。
# 读取文件def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read()# 识别本地文件aipSpeech.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'lan': 'zh',})# 从URL获取文件识别aipSpeech.asr('', 'pcm', 16000, { 'url': 'http://121.40.195.233/res/16k_test.pcm', 'callback': '/receive',})
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
返回结果:
// 成功返回{ 'err_no': 0, 'err_msg': 'success.', 'corpus_no': '15984125203285346378', 'sn': '481D633F-73BA-726F-49EF-8659ACCC2F3D', 'result': ['北京天气']}// 失败返回{ 'err_no': 2000, 'err_msg': 'data empty.', 'sn': null}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15