商品参数
图解语音识别
定价 59.00
出版社 人民邮电出版社
版次 1
出版时间 04月
开本 32开
作者 [日]荒木雅弘
装帧 平装-胶订
页数
字数
ISBN编码 9787115528711
重量
内容介绍
本书从语音识别的历史和基础知识讲起,通过图解的方式对语音识别技术进行了尽可能简单的解释。内容涉及语音学基础知识、统计模式识别、有限状态自动机、语音特征的提取、声学模型和语言模型、搜索算法和基于WFST 的语音识别技术等。 此外,本书没有将语音识别限定在“将语音转换成文本”的传统范畴内,而是在此基础上,还讲解了从语音识别技术到人机对话技术的演进过程和方法。内容涉及语义分析和语音对话系统的实现。
目录
目录
第 1章 开篇
1.1什么是语音识别 2
1.2语音识别的历史 4
1.3语音识别的用处 6
1.4为什么很难 8
1.5本书的目标 10
1.6小结 12
第 2章 什么是语音
2.1语音学 16
2.2声音是如何产生的——发音语音学 16
2.3声音的真面目——声学语音学 23
2.4声音是如何被感知的——感知语音学 29
2.5总结 32
第3章 统计模式识别
3.1什么是模式识别 34
3.2统计模式识别的思路 36
3.3生成模型的训练 40
3.4判别模型的训练 44
3.5统计语音识别的概要 45
3.6总结 48
第4章 有限状态自动机
4.1什么是有限状态自动机 50
4.2用有限状态自动机表达的语言 53
4.3各种各样的有限状态自动机 55
4.4有限状态自动机的性质 58
4.5总结 59
第5章 语音特征的提取
5.1特征提取的步骤 62
5.2语音信号的数字化 64
5.3人类听觉模拟——频谱分析 67
5.4另一个精巧设计——倒谱分析 69
5.5噪声去除 72
5.6总结 73
第6章 语音识别:基本声学模型
6.1声学模型的单位 76
6.2什么是隐马尔可夫模型 78
6.3隐马尔可夫模型的概率计算 81
6.4状态序列的估计 83
6.5参数训练 85
6.6总结 89
第7章 语音识别:高ji声学模型
7.1实际的声学模型 92
7.2判别训练 94
7.3深度学习 96
7.4总结 98
第8章 语音识别:语言模型
8.1基于语法规则的语言模型 100
8.2统计语言模型的思路 101
8.3统计语言模型的建立方法 103
8.4总结 108
第9章 语音识别:搜索算法
9.1填补声学模型和语言模型之间的空隙 112
9.2状态空间搜索 113
9.3用树形字典减少浪费 115
9.4用集束搜索缩小范围 116
9.5用多次搜索提高精度 118
9.6总结 120
第 10章 语音识别:WFST运算
10.1WFST的合成运算 124
10.2确定化 129
10.3权重移动 133
10.4*小化 134
10.5总结 135
第 11章 语音识别:使用 WFST进行语音识别
11.1WFST转换 138
11.2声学模型的 WFST转换 139
11.3发音字典的 WFST转换 141
11.4语言模型的 WFST转换 142
11.5WFST的搜索 144
11.6总结 145
第 12章 语义分析
12.1什么是语义表示 148
12.2基于规则的语义分析处理 151
12.3基于统计的语义分析处理 153
12.4智能手机的语音服务 156
12.5总结 159
第 13章 语音对话系统的实现
13.1对话系统的开发方法 162
13.2基于规则的对话管理 164
13.3针对对话管理的统计方法 166
13.4总结 170
第 14章 终篇
14.1语音分析工具 WaveSurfer 174
14.2HMM构建工具 HTK 175
14.3大词汇量连续语音识别引擎 Julius 177
14.4虚拟代理对话工具 MMDAgent 179
14.5深入学习之路 180
思考题的解答 182
参考文献 188
后 记 191
显示全部信息
《正版 图解语音识别 语音识别入门实践教程 语音识别技术书 人工智能机器学习深度学习计算机网络编程书籍R3Z978》[日]荒木雅弘著【摘要 书评 在线阅读】-苏宁易购图书...