第一句子网 > 一种语音交互点读装置的制作方法

一种语音交互点读装置的制作方法

时间：2021-01-23 12:15:01

相关推荐

一种语音交互点读装置的制作方法

本发明涉及点读技术领域，尤其涉及一种语音交互点读装置。

背景技术：

目前，点读笔是一种能够进行语音播放、点读、复读、录音等功能的学习辅的工具。

现有技术中，点读笔大都不具备语音对话交互功能。结合人工智能技术的语音对话交互使产品能够更好地“理解”用户，使传统设备的应用变得更为智能和有趣，适应现代人的需求。

如今语音对话交互多出现在专门的智能设备，如智能机器人、智能应用app等产品端，此类产品的应用场景具有一定的局限性，多局限于家庭场合，父母陪伴使用的环境，儿童或学生独立实用型的教育产品有待与智能语音对话的结合。

技术实现要素：

鉴于上述技术问题，本发明实施例提供一种语音交互点读装置，能够满足智能语音对话及阅读用户的不同使用情境，并扩展点读笔的功能。

本发明的实施例一方面提供一种语音交互点读装置，包括：

点读笔和与所述点读笔无线连接的语音对话服务器；

所述点读笔包括：点读笔本体，设置在所述点读笔上的处理模块、拍摄模块、发声模块、录音模块、第一通信模块；

所述拍摄模块与所述处理模块连接，读取点读书籍上的隐形码，并索引该隐形码对应的音频信息或对话脚本节点信息；

所述发声模块与所述处理模块连接，播放所述音频信息或对话脚本节点信息；

所述录音模块与所述处理模块连接，用于将用户的语音录制成录音文件；

所述第一通信模块与所述处理模块连接，用于将所述录音文件发送至语音对话服务器；

所述语音对话服务器对所述录音文件进行语音识别和自然语言理解，根据所述自然语言理解结果选取对应的对话脚本节点信息，并将所述节点信息传回所述点读笔，所述点读笔通过所述发声模块播放所述节点信息。

所述语音对话服务器，还用于：

识别所述点读笔的唯一标识id信息，并向所述语音对话服务器对应所述id信息的区域发送所述录音文件。

所述点读笔还包括：

第一显示模块，用于显示所述对话脚本节点信息。

所述点读笔还包括用于与智能终端进行通信的附加通信模块。

还包括智能终端：

所述智能终端与所述语音对话服务器以及所述点读笔均无线连接，所述智能终端具有用于显示所述对话脚本节点信息的第二显示模块。

所述智能终端与所述语音对话服务器以及所述点读笔均无线连接包括：

所述智能终端与所述点读笔无线连接，已识别所述点读笔的唯一标识id信息，并与所述点读笔建立一对一的对应关系；

所述智能终端与所述语音对话服务器无线连接，以从所述语音对话服务器中获取特定标识id信息所对应的点读笔的对话脚本节点信息。

所述语音对话服务器包括：

第二通信模块，用于接收所述录音文件；

语音识别模块，用于对所述录音文件进行语音识别，并进行文本信息转写；

智能对话模块，用于对所述文字进行语意理解，并根据理解结果选择所述录音文件对应的对话脚本和节点信息。

所述智能对话模块包括：

自然语言理解单元，用于根据所述文本信息进行自然语言理解，获得语意分析的结果；

智能分析单元，利用自然语言理解获得的结果，进行对话脚本的选择和节点信息的选择；

系统话语生成单元：根据智能分析的结果，将对话脚本节点信息进行整合输出。

所述语音对话脚本以对话树的结构进行存储，可根据用户回复进行不同分支的对话；

每个识别处对应多个对话脚本，根据识别处的情境进行个性化设计和编写，用以与用户进行多轮语音对话交互。

所述点读笔和所述语音对话服务器有线连接。

上述技术方案具有如下优点或有益效果：

本发明各个实施例中，语音对话功能的点读装置通过将点读笔与语音对话服务器结合，对点读笔功能进行了扩展，使点读笔不仅具备基本的点读功能，还具备了语音对话的功能，如此，用户能能够在阅读的过程中，一遍听取绘本故事，一边与插图或材料中的人物进行智能语音对话交互，使阅读更为有趣、深刻，知识的获得更为有效。此外，由于点读笔的应用场景不受限，无论是学龄前儿童还是在校学生，都能在家庭或学校等地方通过使用点读笔体验听读的乐趣，真正实现了沉浸式阅读。

附图说明

图1为本发明实施例一中语音交互点读装置结构示意图。

图2为本发明实施例二中语音交互点读装置结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

本发明各个实施例中，包括了点读笔和与所述点读笔无线连接的语音对话服务器，用户通过所述点读笔读取点读书籍上的隐形码，对应的识别部分会进入所述隐形码对应的主动语音对话交互；用户进入对话时，点读笔将用户输入的语音发送至语音对话服务器，所述语音对话服务器对所述语音文件进行语音识别和自然语言理解，根据自然语言理解的结果选择对应脚本中的节点信息，并将解析后的节点信息返回所述点读笔。本发明具有语音对话功能的点读装置通过点读笔与语音对话服务器相结合，不仅对点读笔的功能进行了扩展，而且能满足用户不同的阅读情境，使阅读与智能语音交互变得更为有趣和方便。

图1为本发明实施例一中语音交互点读装置结构示意图。如图1所示，该装置包括：

点读笔10与所述点读笔10无线连接的语音对话服务器20；

所述点读笔10包括：点读笔本体，设置在所述点读笔本体上的处理模块110、拍摄模块120、发生模块130、录音模块140、第一通信模块150以及存储模块170；

所述拍摄模块120与所述处理模块110连接，读取点读绘本上的隐形码，并索引该隐形码对应的标准音频信息和标准文本信息；

所述发声模块130与所述处理模块110连接，播放所述标准音频信息；

所述录音模块140与所述处理模块110连接，用于将所述录音文件发送至所述语音对话服务器20；

所述语音对话服务器20对所述录音文件进行语音识别和语意理解，根据所述语意理解结果进行对话脚本节点信息的选择，并将节点信息传回所述点读笔10，所述点读笔10通过所述发声模块130播放所述节点信息。

本实施例的语音对话服务器20可以存储大量点读笔10的语音对话信息，在本实施例中，为了使得不同点读笔10的对话信息能够区分开，每一点读笔10具有唯一标识id信息。

具体地，所述录音文件发送至所述语音对话服务器20包括：所述语音对话服务器20识别所述点读笔10的唯一id信息，并向所述语音对话服务器20对应所述id信息的区域发送所述录音文件。如此，每一点读笔10的录音文件都能将录音文件发送至语音对话服务器20的对应存储区域，进而实现点读笔10与语音对话服务器20之间的一一对应存储和调取对话脚本节点信息。

点读笔10能够通过发声模块130播放对话脚本节点信息，该节点信息能够引导用户进入多轮对话，引起用户的听觉刺激，为了同时对用户实现视觉刺激。

本实施例中，所述点读笔10还包括与所述处理模块110连接的第一显示模块160，所述第一显示模块160用于显示所述对话脚本节点信息，其中可能包含文字、图片、动画等信息中的一种或多种。如此，当用户使用点读笔10进行阅读时，首先点读笔10的拍摄模块120读取点读绘本上的隐形码，并索引该隐形码对应的音频信息或对话脚本节点信息；随后点读笔的发生模块130能够播放音频或对话脚本节点信息。相应地，点读笔10的第一显示模块160显示对话脚本节点信息，如此，用户的听觉和视觉同时进行播放和互动体验，完成互动交流式的阅读。

当用户完成语音对话输入后，语音对话服务器20将会向点读笔10返回下一轮对话脚本节点信息。脚本节点信息的呈现方式有：通过发声模块130读出或者通过第一显示模块160显示节点信息。具体而言，发声模块130读出的节点信息包括：文字、图片、动画等信息中的一种或几种。

所述节点信息由语音对话服务器20的智能对话模块230通过所述节点信息的选择获得，进而通过第一显示模块160对所述节点信息进行显示。由于点读笔的体积较小，而第一显示模块160是设置在点读笔10本体上的，因此，第一显示模块160的体积较小，只显示有特色的小图标。

为了支持语音对话功能，本实施例语音对话系统的点读笔10的硬件系统和软件系统进行了优化设计。点读笔10的硬件系统采用ram容量可扩展的设计方式；可以保障运行linux和android开源操作系统。点读笔10的第一通信模块150可以是wifi通信模块或蓝牙通信模块或4g通信模块；点读笔10的发声模块可以为耳机和/或扬声器输出；点读笔10的第一显示模块160可以为黑白或者彩色显示屏。

为了能够同时语音对话脚本节点的各种信息，所述语音对话服务器20包括：第二通信模块210，语音识别模块220及智能对话模块230，该第二通信模块210用于接收所述录音文件；该语音识别模块220用于对所述录音文件进行语音识别文字转写；该智能对话模块230用于根据文字信息进行自然语言理解，根据理解获得的结果选择对话脚本节点信息。

所述智能对话模块230包括：自然语言理解单元、智能分析单元、系统话语生成单元。所述自然语言理解单元能够根据所述文本信息进行语意理解；所述智能分析单元能够根据所述语意理解的结果选择对应的对话脚本节点；系统话语生成单元能够解析所述节点信息并整理成系统话语(自然语言)。如此，智能对话模块能够输出与用户进行语音对话的信息。

具体的，现有的点读笔一般只有点读功能，使用时，选择要点读的资料，点击该页上的插图、文字等信息。现有的点读笔大都不具备语音对话交互功能。本实施例结合人工智能技术的语音对话交互使产品能够更好地“理解”用户，使传统设备的应用变得更为智能和有趣，适应现代人的需求。

本实施例对传统点读笔功能进行了扩展，即：将点读笔10与语音对话服务器20相结合，如此，用户能够一边听点读笔10的发音内容，一边跟点读笔进行智能语音互动交流，使阅读和学习变得更为有趣，真正实现沉浸式阅读，且能够通过语音对话系统20实时进行多轮对话。且由于点读笔10的应用场景不受限制，无论学龄前儿童还是学生，都能在家里或者学校等场合使用点读笔10进行阅读和智能语音交互，真正实现快乐阅读。

进一步的，本发明技术方案的另一个实施例提供了另一种语音交互点读装置，图2为本发明实施例二中语音交互点读装置结构示意图。

如图2所示，为了进一步显示详细的对话脚本节点信息，所述装置还包括智能终端30，所述智能终端30与所述语音对话服务器20及所述点读笔10均为无线连接，所述智能终端30用于显示所述节点信息。

具体地，所述智能终端30包括第二显示模块310、第三通信模块320及用于启动语音对话功能的应用程序。

所述智能终端30通过第三通信模块320与所述点读笔10无线连接，以识别所述点读笔10的唯一id信息，并与所述点读笔10建立一对一的关系；

所述智能终端30与所述语音对话服务器20通过第三通信模块320无线连接，以从所述语音对话服务器20中获取特定id信息所对应的点读笔10的对话脚本节点信息。

所述智能终端30的第二显示模块310用于显示所述节点信息。

所述智能终端30可以为智能手机或平板电脑。因为智能手机和平板电脑具有较大的显示屏，因而，能够显示较多的对话脚本节点信息。在此需要说明的是，手机、平板电脑等智能终端30是优化的实施例，因为可以显示更多的对话脚本节点信息，一般用在对智能终端30不做限制的应用场景。

具体的，上述各个实施例中，点读笔10、语音对话服务器20、智能终端30之间也可以是有线连接。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理包括，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-onlymemory，简称rom)、随机存取存储器(randomaccessmemory，简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述的是本发明的优选实施方式，应当指出对于本技术领域的普通人员来说，在不脱离本发明所述的原理前提下还可以做出若干改进和润饰，这些改进和润饰也在本发明的保护范围内。

技术特征：

1.一种语音交互点读装置，其特征在于，包括：

点读笔和与所述点读笔无线连接的语音对话服务器；

所述点读笔包括拍摄模块、录音模块、发声模块以及第一通信模块；其中，

所述拍摄模块，用于读取点读书籍上的隐形码，并索引所述隐形码对应的音频信息或对话脚本节点信息；

所述发声模块，用于播放所述音频信息或对话脚本节点信息；

所述录音模块，用于将用户的话语录制成音频文件；

所述第一通信模块，用于将所述音频文件发送至所述语音对话服务器；

所述语音对话服务器，用于对所述录音文件进行语音识别和自然语言理解，根据自然语言理解结果选择对话脚本节点信息，并将所述对话脚本节点信息发送所述点读笔；

所述点读笔通过所述发声模块播放所述对话脚本节点信息。

2.根据权利要求1所述的语音交互点读装置，其特征在于，所述语音对话服务器，还用于：

识别所述点读笔的唯一标识id信息，并向所述语音对话服务器对应所述id信息的区域发送所述录音文件。

3.根据权利要求1所述的语音交互点读装置，其特征在于，所述点读笔还包括：

第一显示模块，用于显示所述对话脚本节点信息。

4.根据权利要求1所述的语音交互点读装置，其特征在于，所述点读笔还包括用于与智能终端进行通信的附加通信模块。

5.根据权利要求1所述的语音交互点读装置，其特征在于，还包括智能终端：

所述智能终端与所述语音对话服务器以及所述点读笔均无线连接，所述智能终端具有用于显示所述对话脚本节点信息的第二显示模块。

6.根据权利要求5所述的语音交互点读装置，其特征在于，所述智能终端与所述语音对话服务器以及所述点读笔均无线连接包括：

所述智能终端与所述点读笔无线连接，已识别所述点读笔的唯一标识id信息，并与所述点读笔建立一对一的对应关系；

所述智能终端与所述语音对话服务器无线连接，以从所述语音对话服务器中获取特定标识id信息所对应的点读笔的对话脚本节点信息。

7.根据权利要求1所述的语音交互点读装置，其特征在于，所述语音对话服务器包括：

第二通信模块，用于接收所述录音文件；

语音识别模块，用于对所述录音文件进行语音识别，并进行文本信息转写；

智能对话模块，用于对所述文字进行语意理解，并根据理解结果选择所述录音文件对应的对话脚本和节点信息。

8.根据权利要求7所述的语音交互点读装置，其特征在于，所述智能对话模块包括：

自然语言理解单元，用于根据所述文本信息进行自然语言理解，获得语意分析的结果；

智能分析单元，利用自然语言理解获得的结果，进行对话脚本的选择和节点信息的选择；

系统话语生成单元：根据智能分析的结果，将对话脚本节点信息进行整合输出。

9.根据权利要求1所述的语音交互点读装置，其特征在于，所述语音对话脚本以对话树的结构进行存储，可根据用户回复进行不同分支的对话；

每个识别处对应多个对话脚本，根据识别处的情境进行个性化设计和编写，用以与用户进行多轮语音对话交互。

10.根据权利要求1所述的语音交互点读装置，其特征在于，包括：

所述点读笔和所述语音对话服务器有线连接。

技术总结

本发明的实施例提供了一种语音交互点读装置，包括了点读笔和与所述点读笔无线连接的语音对话服务器，用户通过所述点读笔读取点读书籍上的隐形码，对应的识别部分会进入所述隐形码对应的主动语音对话交互；用户进入对话时，点读笔将用户输入的语音发送至语音对话服务器，所述语音对话服务器对所述语音文件进行语音识别和自然语言理解，根据自然语言理解的结果选择对应脚本中的节点信息，并将解析后的节点信息返回所述点读笔。本发明通过点读笔与语音对话服务器相结合，不仅对点读笔的功能进行了扩展，而且能满足用户不同的阅读情境，使阅读与智能语音交互变得更为有趣和方便。

技术研发人员：陈访访

受保护的技术使用者：南京芝兰人工智能技术研究院有限公司

技术研发日：.06.29

技术公布日：.01.07

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。