1.语音识别
登录科大讯飞官网,注册账号后转到“语音识别”栏目,下载SDK,如图:
我选择了 语音听写和语音合成,都是在线的。选好后生成SDK,下载到本地,然后在linux系统中解压,并进入sample目录的iat_online_record_sample目录下。
执行 source 64bit_make.sh
此时会提示“alsa/asound.h:没有那个文件或目录”。解决办法:
sudo apt-get install libasound2-dev
然后就可以去../../bin目录下执行对应的可执行文件了。
ubutnu18的检查麦克风是否可用的设置在这里:
可以通过说话检测input level是否会随之变化。
2.语音合成
进入到sample目录的tts_online_sample目录下。
执行 source 64bit_make.sh
然后就可以去../../bin目录下执行对应的可执行文件了。
它会根据源码中预设的文本合成语音,并生成wav文件在bin目录下。播放wav文件的方法是
安装sudo apt-get install soxsudo apt-get install libsox-fmt-all然后在C代码中写上{system("play tts_sample.wav");}就可以播放了。
于是我通过改这两个文件,合成了一个语音识别后将文字再合成语音播放出来,由于Makefile基本是相同的,因此将各自的main函数合到一起就可以了。