第一句子网 > 一种评分生成方法装置存储介质及电子设备与流程

一种评分生成方法装置存储介质及电子设备与流程

时间：2022-09-30 02:02:21

本申请涉及计算机

技术领域：

，尤其涉及一种评分生成方法、装置、存储介质及电子设备。

背景技术：

：随着时代的发展，全球一体化趋势日渐明显，越来越多的人希望学习和掌握一门或几门纯正流利的外语，以便于更方便的交流。在学习外语的过程中，口语的地位尤为重要。目前，用户多采用计算机辅助语言学习系统学习口语，在计算机辅助语言学习系统中包含有口语评分单元，通过该口语评分单元可判断用户的口语发音是否准确。然而，这种口语评分单元只能对用户已经发音的词语的标准度进行评分，而一旦用户在练习长篇对话或长篇文章的过程中存在遗漏词语和/或冗余词语的情况，就无法准确的对该长篇对话或长篇文章进行评分，进而降低了语音评分的准确性。技术实现要素：本申请实施例提供了一种评分生成方法、装置、存储介质及电子设备，可以提高语音评分的准确性。所述技术方案如下：第一方面，本申请实施例提供了一种评分生成方法，所述方法包括：采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本；将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息；基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分；第二方面，本申请实施例提供了一种评分生成装置，所述装置包括：文本获取模块，用于采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本；信息获取模块，用于将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息；评分生成模块，用于基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。第三方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法步骤。第四方面，本申请实施例提供一种电子设备，可包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。本申请一些实施例提供的技术方案带来的有益效果至少包括：在本申请一个或多个实施例中，用户终端采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本，并将所述测评文本与样本文本进行比对，然后获取所述测评文本与所述样本文本之间的差异文本信息，最后基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。通过将所获取的测评文本与样本文本进行对比得到差异文本信息，然后根据差异文本信息进行评分，就可以实现对用户输入的语音测评集合进行准确评分，从而提高了语音评分的准确性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1是一个或多个实施例提供的评分生成的场景架构示意图；图2是一个或多个实施例提供的评分生成方法的流程示意图；图3是一个或多个实施例提供的评分生成方法的界面示意图；图4a是一个或多个实施例提供的评分生成方法的用户验证界面的示意图；图4b是一个或多个实施例提供的评分生成方法的测试提示界面的示意图；图4c是一个或多个本申请实施例提供的评分生成方法的录音开始界面的示意图；图4d是一个或多个实施例提供的评分生成方法的采集语音界面的示意图；图4e是一个或多个实施例提供的评分生成方法的提交测评界面的示意图；图4f是一个或多个实施例提供的评分生成方法的提交成功界面的示意图；图5是一个或多个实施例提供的评分生成方法的流程示意图；图6是一个或多个实施例提供的评分生成方法的界面示意图；图7是一个或多个实施例提供的评分生成方法的界面示意图；图8是一个或多个实施例提供的评分生成装置的结构示意图；图9是一个或多个实施例提供的评分生成装置中的集合获取模块的结构示意图；图10是一个或多个实施例提供的电子设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。在本申请的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。在本申请的描述中，需要说明的是，除非另有明确的规定和限定，“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。此外，在本申请的描述中，除非另有说明，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。下面结合具体的实施例对本申请进行详细说明。请参见图1，为本申请实施例提供的一种评分生成系统的架构示意图。如图1所示，所述评分生成系统可以包括用户110和评分生成装置120。所述评分生成装置120可以为电子设备，该电子设备包括但不限于：个人电脑、平板电脑、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中用户终端可以叫做不同的名称，例如：用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personaldigitalassistant，PDA)、5G网络或未来演进网络中的终端设备等。也可以为具备评分处理功能的服务器。为了描述方便，本申请实施例中以评分生成装置为用户终端为例进行说明。如图1所示，用户110向用户终端120输入测评语音指令，用户终端120接收所述测评语音指令之后，用户终端120对用户110的测评语音指令作出响应，加载预先设置好的样本文本，并在显示屏上显示所述样本文本。用户110根据显示屏上样本文本开始输入测评语音。此时，用户终端120可以通过内置的录音采集装置或外置的录音采集装置采集用户110输入的测评语音，音频采集装置可以是一个或多个话筒(也称为麦克风)。在话筒的数量为多个的情况下，多个话筒可以分布在不同的位置组成话筒阵列，用户终端通过话筒阵列获取每个话筒采集到的测评语音集合，将多个通道采集到的测评语音集合进行合并得到高保真的测评语音集合。可选的，在音频采集装置外置的情况下，音频采集装置可以通过预设长度(如3.5mm)的耳机插口、USB接口或蓝牙将采集到的测评语音实时传输给用户终端120。用户终端120将测评语音保存至测评语音集合。用户终端120可以分多次采集用户110的测评语音集合，然后根据用户110的选择指令从多个测评语音集合中选择一个最终的测评语音集合。例如：用户小明想要测试自己的外语口语水平，此时用户小明打开手机终端的测评语音软件，在测评语音界面通过点击测评语音按钮发出测评语音请求，此时，手机终端响应于用户的测评语音请求，在显示屏上显示样本文本和相应的提示消息，手机终端内置有2个麦克风，分别分布在手机终端的底部和顶部，手机终端通过2个麦克风采集用户小明的测评语音集合，对两个麦克风采集通道上采集的测评语音集合进行滤波和降噪等过程之后得到高保真的测评语音集合，并保存下来。用户终端120获取所述测评文本与所述样本文本之间的差异信息。具体的，用户终端120在标准语音信息库中获取测评语音集合中的当前测评语音，获取所述当前测评语音对应的测评语音曲线，然后获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合，再获取所述相似度集合中的相似度最大值，以及所述相似度最大值指示的目标标准语音曲线。此时，将所述目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音。用户终端120在获取到当前测评语音之后，继续获取当前测评语音的下一个测评语音，并将下一个测评语音确定为当前测评语音，再执行获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合的步骤。若用户终端120检测到不存在下一个测评语音时，生成包含所述标准语音的标准语音集合，基于各测评语音的先后顺序，将各测评语音分别对应的标准语音组合为标准语音集合，并基于标准语音信息与文本信息的对应关系，确定所述标准语音集合对应的测评文本。其中，所述标准语音指的是预先设置好的语音，这些语音存储在标准语音信息库中，所述语音信息可以是语音的音高、音强、音长、音色等。所述文本信息指标准语音信息所对应的文本。需要强调的是，此处的文本信息与标准语音信息相对应，可以理解为，在标准语音库中存储的是标准语音信息，以及各标准语音信息分别对应的文本信息。通常是具有完整、系统含义的词、句子、段落等。例如：“Today”语音所对应的文本信息即为书面的单词“Today”，“good”语音所对应的文本信息即为书面的单词“good”，“goodday”语音所对应的文本信息即为书面的词汇“goodday”，“Todayisagoodday”语音所对应的文本信息即为书面的句子“Todayisagoodday”，等等。用户终端120再将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息。所述差异文本信息包括差异文本数量、差异文本内容以及所述差异文本内容的属性(如差异词的词性、句子或段落的重要性，等等)。其中，所述差异文本内容可以包括测评文本与样本文本中的词、句子或段落不一致的文本，所述文本可以包括样本文本中的某些词、句子或段落，还可以包括用户输入测评语音集合时，添加的词、句子或段落。用户终端120根据预先设定的评分规则，将差异文本信息输入到评分模型中进行评分处理，输出测评语音集合对应的评分，然后用户终端120向用户110展示包含本次评分的评分报告。在一个或多个实施例中，用户终端采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本，将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。通过将所获取的测评文本与样本文本进行对比得到差异文本信息，然后根据所述差异文本信息进行评分，就可以实现对用户输入的语音测评集合进行准确评分，从而提高了语音评分的准确性。下面将结合附图2-附图7，对本申请实施例提供的评分生成方法进行详细介绍。其中，本申请实施例中的评分生成装置可以是图1所示的用户终端。请参见图2，为本申请实施例提供了一种评分生成方法的流程示意图。该方法可依赖于计算机程序实现，可运行于基于冯诺依曼体系的评分生成装置上。该计算机程序可集成在应用中，也可作为独立的工具类应用运行。本申请实施例中的评分生成装置可以为图1或上述实施例所描述的用户终端。具体的，该评分生成方法包括：S101：采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本。其中，所述样本文本为用户终端提供的参考文本，该参考文本可以是由字/词组成的句子、段落、文章等。在输入测评语音时，用户根据用户终端提供的所述样本文本输入对应的测评语音集合。例如，用户终端在屏幕显示样本文本：Todayisagoodday，用户根据屏幕显示的样本文本输入“Todayisagoodday”对应的测评语音集合，用户终端实时采集用户所输入的测评语音集合。具体的，测评语音集合是指用户根据用户终端提供的样本文本输入的测评语音，在该集合中可以包括至少一个测评语音，每个测评语音可以理解为是一个测评字或词汇。例如，测评语音集合为“Todayisagoodday”，“Today”、“is”、“a”、“good”、“day”所对应的发音即为该集合中的各测评语音。例如：一个测评语音对应一个测评字或词，所述测评文本包含所述的多个的测评字或词。具体的，用户终端响应于用户的测评语音指令，在屏幕显示样本文本并提示用户通过麦克风输入测评语音，用户参照样本文本完成测评语音的输入。可选的，用户输入的测评语音指令可以是通过外部设备完成的，例如用户可以通过连接用户终端的鼠标选中用户终端的显示界面的测评语音按钮输入测评语音请求，可以是用户通过连接用户终端的键盘或者触摸板输入相应指令进行的，可以是用户通过语音输入进行测评语音的指令，可以是用户通过摄像头采集手势控制指令完成测评语音指令的操作，还可以是通过触控用户终端屏幕选中测评语音按钮等。需要说明的是，完成操作的方式有多种，此处不作具体限定。可选的，用户终端通过麦克风采集用户输入的测评语音集合，所述麦克风可以是内置的或者外置的一个或者多个，在麦克风数量为多个时，可以根据实际需求设计麦克风的放置位置，放置方式可以是不同的角度放置，以便采集到更优质的测评语音集合，进而生成优质的测评语音集合，当用户终端在测评语音时间结束后或用户触发提交语音测评指令后，将采集到的测评语音集合保存。可选的，在采集用户测评语音集合的过程中，对于用户终端来说，用户终端通过麦克风采集测评语音集合会有一个有效语音采集距离范围，所述有效语音采集距离范围是指用户在该范围内所采集到的语音可以被识别。在一种可能的实施方式中，用户终端对用户输入的测评语音集合实时监测，判断用户是否处于有效语音采集距离范围之内，当用户在有效语音采集范围之外时，用户终端则展示提示信息，所述提示信息用于指示用户调整与用户终端的相对距离。例如，用户终端的麦克风采集有效语音范围是0-30cm，用户在离用户终端麦克风35cm的位置输入测评语音集合，用户终端实时监测到用户距离过远，不在有效语音采集范围之内，用户终端在显示屏上展示如图3所示“距离过远，请调整与麦克风的距离”的文本提示信息，提示用户调整与麦克风的距离，用户此时可以通过拉近与麦克风的距离从而采集到更优质的测评语音集合。可选的，用户终端可以分多次采集用户的测评语音集合，然后根据用户的选择指令从多个测评语音集合中选择一个最终的测评语音集合。在一种可行的实现过程中，用户终端显示界面的显示可以参考如图4a-图4f所示的方法，其中包含如图4a所示的用户图像验证界面，在该界面上包括面部图像预览区和提示信息的图形界面，该提示信息可以用于提示语音测评者使用手机的前置摄像头输入面部图像，以及将面部图像置于面部图像预览区中，用户终端在面部图像预览区中检测到当前面部图像与预设的语音测评者面部图像相匹配时，即用户身份验证成功，进而触发下一步采集测评语音集合的步骤。进一步的，用户终端显示界面还可以包含如图4b所显示的测试前提示界面，所述提示界面包含本次语音测试的相关信息和测试确认按钮，例如测试时间、测试环节、测试具体的注意事项等，所述用户终端在当前页面检测到确认按钮上的单击触摸动作时，如图4c所示，显示包含样本文本、测试开始提示信息和语音测评开始按钮的图形界面，所述语音测评开始按钮为图形界面上的一个控件，用于触发用户终端的测评语音正式开始的操作，用户根据样本文本所提示的信息输入对应的测评语音集合。进一步的，用户通过用户终端输入测评语音集合，在输入的过程中，用户终端可以通过显示界面显示如图4d的页面内容，页面内容包含有当前测评输入的总时间，所示总时间可以方便用户合理掌控时间进度。在一种可能的实施方式中，用户终端显示的图形界面包括语音测评的完成按钮，用户终端检测到完成按钮上的触发动作时，将采集到的测评语音集合保存，方便用户终端的处理器处理。其中，为了防止用户误触发完成指令，可以设置复杂度高的触发动作，例如：在测评时间没有结束的情况下，用户想提前结束测评，如果在3秒内，用户连续三次点击提交按钮才能成功生成提交指令，还可以是设置提交的流程来避免误操作，可参考图4d，用户点击完成按钮提交语音测评集合，触发用户终端在显示界面上显示如图4e的提交确认信息，当用户想要提交当前语音测评集合时，点击确认即可提交，此时触发用户终端在显示界面显示测评等待界面，可参考图4f，所示界面包含本次语音测评集合的信息和提示信息，例如测评用时等。可选的，用户终端在采集用户输入的语音测评集合的过程中，采集的语音会因为环境噪声、回声等干扰因素影响采集语音的质量，在实际实施中，会对通过麦克风采集阵列采集的语音进行预处理，所述预处理包含端点检测、降噪、波束形成，经过预处理后的语音进行后置滤波消除残留的语音噪声，然后通过自动增益算法调节采集的语音能量，最后用户终端对处理之后的语音集合进行保存，由用户终端处理器对保存的测评语音集合进行语音识别转换成对应的测评文本。S102：将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息。其中，所述差异文本指的是测评文本与样本文本中的词、句子或段落不一致的文本，所述文本可以包括样本文本中的某些词、句子或段落，还可以包括用户输入测评语音集合时，添加的词、句子或段落。所述差异文本信息包括差异文本数量、差异文本内容以及所述差异文本内容的属性(如差异词的词性、句子或段落的重要性，等等)。具体的，用户终端将转换的测评文本与样本文本进行比对，在比对的过程中将不一致的差异文本的信息记录下来，便于用户终端基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。举例来说，用户终端通过对采集的测试语音集合进行语音识别得到转换后的测评文本。上述测评文本例如是包括以下的信息：Bestoftimesitwastheoftimes，itwasthetheworstoftimes,itwastheageofwisdom,itwastheageoffoolishness.样本文本例如是包括以下的信息：Bestoftimesitwasthebestoftimes，itwastheworstoftimes,itwastheageofwisdom,itwastheageoffoolishness.经过比对，得到差异文本为：漏掉“best”，冗余“the”。可选的，用户终端可以对差异文本添加属性标识，所述属性标识用来记录差异文本的属性，例如差异文本在样本文本中的位置、差异文本的词性、差异类型等。具体添加属性标识方法可以是当前根据预定的规则生成的一组二进制随机数列，还可以是根据预定的规则生成的一组长整型字符串，此处不作具体限定，下面为了实施例说明的方便，以生成的一组二进制码表示。其中一种可行的实现方式为，每个差异文本都有一属性标识，每个属性标识采用一组二进制码表示，这里以10位为例。8位二进制码的前两位表示遗漏和冗余，具体：01(遗漏)，10(冗余)；第3位和第4位表示差异类型，具体01(词)，10(句子)，11(段落)，第5位到第8位表示差异文本具体的位置参数。例如，如表1所示，上述差异文本信息可以是通过表1所示的方法记录。表1差异文本属性标识best0101000111the1001001100S103：基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。具体的，用户终端可以根据预设的评分规则，将差异文本信息输入到评分模型中进行评分处理，输出测评语音集合对应的评分，用户终端生成包含本次测评评分的评分报告并在显示界面显示，所述测评报告包含用户测评语音过程中遗漏或冗余的词语和语音属性信息，语音属性信息包括但不限于：语速信息、语调信息和音色。进一步的，语音测评报告还可以包括标准语音的发音以及本次语音的评价。可选的，所述评分模型可以是使用大量的测试样本训练出来的，如评分模型可以是基于卷积神经网络(ConvolutionalNeuralNetwork，CNN)模型，深度神经网络(DeepNeuralNetwork，DNN)模型、循环神经网络(RecurrentNeuralNetworks，RNN)、模型、嵌入(embedding)模型、梯度提升决策树(GradientBoostingDecisionTree，GBDT)模型、逻辑回归(LogisticRegression，LR)模型中的至少一种实现的，基于已经标注的样本数据对评分模型进行训练，可以得到训练好的评分模型。在一个或多个实施例中，用户终端采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本，将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。通过将所获取的测评文本与样本文本进行对比得到差异文本信息，然后根据所述差异文本信息进行评分，就可以实现对用户输入的语音测评集合进行准确评分，从而提高了语音评分的准确性。请参见图5，图5是本申请提出的一种评分生成方法的另一种实施例的流程示意图。具体的：S201：采集所输入的测评语音集合，在标准语音信息库中获取所述测评语音集合中的当前测评语音。具体采集方法请参考步骤S101，此处不再赘述。具体的，所述语音是指语言的声音，它是语言符号系统的载体，用户终端采集的测评语音实际上是一种信号波，用户终端在开始对所述测评语音集合进行识别时，需要对采集的信号波进行预处理，同时对信号波进行分帧，此时语音就变成了很多小段，然后对语音的信号波形作时域变换，所述时域变换常用的方法是提取梅尔频率倒谱特征(MelFrequencyCepstralCoefficents，MFCC)特征信息，根据人耳的生理特性，把每一帧信号波形变成一个多维向量，可以简单地理解为这个向量包含了这帧语音的内容信息，即包含了测评语音的内容信息。需要说明的是提取特种信息的方法不止有MFCC这一种，经过上述过程之后，采集到的测评语音就成了一个多维向量矩阵。所述测评语音集合实际上是由多个词的发音组成的集合，词的发音由音素构成，对于英语这门语言来说，一种常用的音素集由39个音素构成，通常把一个音素分成3个状态，所述状态指的是语音单位，在对信号波进行分帧以后，若干个帧对应一个状态，每3个状态就构成了一个音素，若干个音素就组成了一个词。所述标准语音信息库是存放词发音的信息库，用户终端采集到测评语音集合，并在标准语音信息库中获取所述测评语音集合中第一个词发音对应的标准语音，将获取到的标准语音作为当前测评语音。S202:获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合。具体的，语音信息包含语音曲线，通过上述标准语音信息库就可以把声学模型和语言模型连接起来，例如，对于英语来说，一个句子可以分成若干个单词相连接，每个单词在标准语音信息库对应着单词发音的音素序列，所述音素序列是由标准语音信号波分帧变换之后得到的，所述语音信号波通常指的是语音曲线。用户终端采集到测评语音集合，并在标准语音信息库中获取所述测评语音集合中的当前测评语音，具体获取当前测评语音对应的测评语音曲线，然后在标准语音曲线集合中查找与测评语音曲线具有相似度的标准语音曲线，所述相似度及标准语音曲线对应保存至相似度集合中。例如，用户终端采集到的测评语音集合，经过上述处理对应着5个音素序列，每一个音素序列对应着一段测评语音曲线，假设现有测评语音曲线A、B、C、D、E，用户终端首先获取测评语音曲线A，然后在储存有标准语音曲线的集合中，查找与测评语音曲线A相似的标准语音曲线。用户终端通过查找找到了3条具有相似度的语音曲线，对应相似度关系可见下表2。表2名称相似度状态标准语音曲线180正常标准语音曲线260正常标准语音曲线340正常表中所述状态用于表明所述具有相似度的语音曲线是否能被终端获取到。S203：获取所述相似度集合中的相似度最大值，获取所述相似度最大值指示的目标标准语音曲线，将所述目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音。具体的，所述相似度集合中显示有多条标准语音曲线的相似度值，以上表2为例，相似度集合中有3条标准语音曲线，分别对应的相似度80、60、40，状态均为正常，用户终端可以获取到表中的标准语音曲线，用户终端首先遍历相似度集合，找出相似度最大值80对应的名称是标准语音曲线1，然后在标准语音曲线集合中找到所述标准语音曲线1，用户终端将标准语音曲线1作为目标标准语音曲线，此时，目标标准语音曲线对应的语音即为所述当前测评语音对应的标准语音。具体的，当前的测评语音在采集过程往往会有噪声等干扰，执行上述步骤之后，就可以将当前测评语音转换为标准语音。S204：获取所述当前测评语音的下一个测评语音，将所述下一个测评语音确定为当前测评语音，并执行所述获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合的步骤。可选的，用户终端在查找到当前测评语音的标准语音曲线之后，获取下一个测评语音，以上所述为例，用户终端找查找到测评语音曲线A对应的标准语音之后，将下一个测评语音作为当前测评语音，具体的是当前通过查找测评语音的测评语音曲线B相似的标准语音曲线，进而获取到标准语音曲线对应的标准语音，所述具体查找步骤可参考S202，此处不再赘述。S205：当检测到不存在下一个测评语音时，生成包含所述标准语音的标准语音集合。具体的，用户终端当检测到所有测评语音都查找完时，即不存在下一个测评语音，此时用户终端将所述所有获取到的标准语音保存至标准语音集合中。以上述为例，用户终端查找完测评语音曲线A、B、C、D、E之后，将获取到的对应的5个标准语音对应保存至标准语音集合。S206：基于所述各测评语音的先后顺序，将所述各测评语音分别对应的标准语音组合为标准语音集合。可选的，用户终端对各测评语音曲线设有优先级参数，所述优先级参数可以是从大到小，从低到高等，假设有测评语音A、B、C、D、E，用户终端对所述各测评语音的优先级等级为A>B>C>D>E，通过上述步骤获取到各测评语音分别对应的标准语音，其对应关系可参考表3。表3测评语音标准语音A001B002C004D003E005可选的，用户终端根据测评语音的优先级等级：A>B>C>D>E，将各测评语音分别对应的标准语音001、002、004、003、005组合为标准语音集合，请考表4。表4标准语音001标准语音002标准语音004标准语音003标准语音005表4为组合的标准语音集合。S207：基于标准语音信息与文本信息的对应关系，确定所述标准语音集合对应的测评文本。具体的，文本信息指的是语言的书面表示形式，通常是具有完整、系统含义的一个句子或多个句子的组合。所述文本信息以英语语言为例，可以是一个词、一个句子、一个段落，所述文本信息可以是语言的实际运用形态，通常在具体实施中指一些语言文字信息。需要强调的是，此处的文本信息与标准语音信息相对应，可以理解为，在标准语音库中存储的是标准语音信息，以及各标准语音信息分别对应的文本信息。通常是具有完整、系统含义的词、句子、段落等。。例如：“he”语音所对应的文本信息即为书面的单词“he”，“likes”语音所对应的文本信息即为书面的单词“likes”，“middleschool”语音所对应的文本信息即为书面的词汇“middleschool”，等等。具体的，所述标准语音指的是预先设置好的语音，这些语音存储在标准语音信息库中，所述语音信息可以是语音的音高、音强、音长、音色等，音高是指声波频率，即每秒钟振动次数的多少；音强指声波振幅的大小；音长指声波振动持续时间的长短，也称为时长；音色指声音的特色和本质，也称作音质。可选的，用户终端基于标准语音信息与文本信息的对应关系从确定标准语音对应的测评文本，可参考表5，表5是标准语音信息与文本信息的一种对应关系。表5标准语音信息文本信息文本类型标准语音001he主语标准语音002likes动词标准语音003riding动词标准语音004a介词标准语音005bike名词由上表的对应关系就可以确定所述标准语音集合对应的测评文本为：Helikesridingabike.S208：将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息，所述差异文本信息包括差异文本数量、差异文本内容以及所述差异文本内容的属性。具体的，所述样本文本为终端预设的文本，当用户终端接收到测评语音请求，可以是用户终端从预设的样本文本库中随机生成的一个样本文本，还可以是如图6所示，用户通过触控用户终端屏幕选择的一个样本文本，所述样本文本对应有样本语音曲线。例如，用户选择的样本文本为：Ihaveagoodfriend.Sheisaprettygirl.ShelivesinJiujiang.Sheisamiddleschoolstudent.Shehasbigeyes,asmallmouth,asmallnoseandaroundface.Sheistallandthin.ShelikeswatchingTVandplayingthebasketball.Ontheweekend,shealwaysplaysbasketballwithherfriendsintheafternoonandwatchesTVintheevening.所述测评文本为：Ihaveagoodgoodfriend.Sheisaprettygirl.ShelivesinJiujiang.Sheisamiddlestudent.Shehasbigeyes,asmallmouth,anoseandaroundface.Sheistallandthin.ShelikeswatchingTVandplayingthebasket.Ontheweekend,shealwaysalwaysplaysbasketballwithherfriendsintheafternoonandwatchesTVintheevening.用户终端通过比对，生成差异文本信息，所述差异文本信息展示形式可以是表6所示的表示方法。表6S209：基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。具体的，用户终端可以根据预设的评分规则，将差异文本信息输入到评分模型中进行评分处理，输出测评语音集合对应的评分，终端生成包含本次测评评分的评分报告并在显示界面显示，所述测评报告包含用户测评语音过程中遗漏、出错、冗余的词语和语音属性信息，语音属性信息包括但不限于：语速信息、语调信息和音色。进一步的，语音测评报告还可以包括标准语音的发音。可选的，用户终端预设的评分规则可以是，设置总分100分，设置扣分基数，及差异类型扣分系数和差异文本词性扣分系数。例如：设置扣分基数为1分，差异扣分类型有3种，分别设置冗余类型的系数为2.0，遗漏类型的扣分系数为3.0，出错类型的扣分类型为4.0，差异文本词性扣分系数可以设置为：名词1.0，动词2.0，形容词2.0，感叹词1.5、副词2.0等，根据差异文本信息可以计算出最终得分：最终得分＝100-1*2.0*2.0-1.0*1.0*3.0-1.0*2.0*3.0-1.0*1.0*4.0-1.0*2.0*2.0＝79可选的，所述用户终端可以根据本次语音测评评分，获取对应的语音测试评价，用户终端生成包含本次测评评分及评价的评分报告并在显示界面显示，如图7所示，所述测评报告可以包含用户测评语音过程中遗漏或冗余的词语和语音属性信息，语音属性信息包括但不限于：语速信息、语调信息和音色。在一个或多个实施例中，用户终端采集所输入的测评语音集合，在标准语音信息库中获取所述测评语音集合中的当前测评语音，并获取所述当前测评语音对应的测评语音曲线，再将该测评语音曲线与标准语音曲线集合中各标准语音曲线进行比对，得到相似度集合，然后获取所述相似度集合中的相似度最大值指示的目标标准语音曲线，将该目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音，并按照相同的方式生成测评语音集合中其它测评语音对应的标准语音，将各测评语音对应的标准语音进行文本转化而得到测评文本，通过比较测评文本与样本文本而对测评语音集合进行评分。通过将所获取的测评文本与样本文本进行对比得到差异文本信息，然后根据所述差异文本信息进行评分，就可以实现对用户输入的语音测评集合进行准确评分，从而提高了语音评分的准确性。下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。请参见图8，其示出了本申请一个示例性实施例提供的评分生成装置的结构示意图。该评分生成装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置1包括文本获取模块11、信息获取模块12和评分生成模块13。文本获取模块11，用于采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本；信息获取模块12，用于将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息；评分生成模块13，用于基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。可选的，如图9所示，所述集合获取模块11具体可以包括：语音集合获取单元110，用于获取所述测评语音集合对应的标准语音集合；测评文本确定单元111，用于基于标准语音信息与文本信息的对应关系，确定所述标准语音集合对应的测评文本。可选的，所述语音集合获取单元110，具体用于：在标准语音信息库中获取所述测评语音集合中各测评语音分别对应的标准语音；基于所述各测评语音的先后顺序，将所述各测评语音分别对应的标准语音组合为标准语音集合。可选的，所述语音集合获取单元110，具体用于：在标准语音信息库中获取所述测评语音集合中的当前测评语音；获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合；基于所述相似度集合确定所述当前测评语音对应的标准语音；获取所述当前测评语音的下一个测评语音，将所述下一个测评语音确定为当前测评语音，并执行所述获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合的步骤；当检测到不存在下一个测评语音时，生成包含所述标准语音的标准语音集合。可选的，所述语音集合获取单元110，具体用于：获取所述相似度集合中的相似度最大值；获取所述相似度最大值指示的目标标准语音曲线，将所述目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音。可选的，所述装置1，其特征在于，所述差异文本信息包括差异文本数量、差异文本内容以及所述差异文本内容的属性。需要说明的是，上述实施例提供的评分生成装置在执行评分生成方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的评分生成装置与评分生成方法实施例属于同一构思，其体现实现过程详见方法实施例，这里不再赘述。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。在一个或多个实施例中，用户终端采集所输入的测评语音集合，在标准语音信息库中获取所述测评语音集合中的当前测评语音，并获取所述当前测评语音对应的测评语音曲线，再将该测评语音曲线与标准语音曲线集合中各标准语音曲线进行比对，得到相似度集合，然后获取所述相似度集合中的相似度最大值指示的目标标准语音曲线，将该目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音，并按照相同的方式生成测评语音集合中其它测评语音对应的标准语音，将各测评语音对应的标准语音进行文本转化而得到测评文本，通过比较测评文本与样本文本而对测评语音集合进行评分。通过将所获取的测评文本与样本文本进行对比得到差异文本信息，然后根据所述差异文本信息进行评分，就可以实现对用户输入的语音测评集合进行准确评分，从而提高了语音评分的准确性。本申请实施例还提供了一种计算机存储介质，所述计算机存储介质可以存储有多条指令，所述指令适于由处理器加载并执行如上述图1-图7所示实施例的方法步骤，具体执行过程可以参见图1-图7所示实施例的具体说明，在此不进行赘述。本申请还提供了一种计算机程序产品，该计算机程序产品存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的评分生成方法。请参见图10，为本申请实施例提供了一种电子设备的结构示意图。如图10所示，所述服务器1000可以包括：至少一个处理器1001，至少一个网络接口1004，用户接口1003，存储器1005，至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(Display)、摄像头(Camera)，可选用户接口1003还可以包括标准的有线接口、无线接口。其中，网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。其中，处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个服务器1000内的各个部分，通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集，以及调用存储在存储器1005内的数据，执行服务器1000的各种功能和处理数据。可选的，处理器1001可以采用数字信号处理(DigitalSignalProcessing，DSP)、现场可编程门阵列(Field-ProgrammableGateArray，FPGA)、可编程逻辑阵列(ProgrammableLogicArray，PLA)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(CentralProcessingUnit，CPU)、图像处理器(GraphicsProcessingUnit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示屏所需要显示的内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器1001中，单独通过一块芯片进行实现。其中，存储器1005可以包括随机存储器(RandomAccessMemory，RAM)，也可以包括只读存储器(Read-OnlyMemory)。可选的，该存储器1005包括非瞬时性计算机可读介质(non-transitorycomputer-readablestoragemedium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等；存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图10所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及评分生成应用程序。在图10所示的服务器1000中，用户接口1003主要用于为用户提供输入的接口，获取用户输入的数据；而处理器1001可以用于调用存储器1005中存储的评分生成应用程序，并具体执行以下操作：采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本；将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息；基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。在一个实施例中，所述处理器1001在执行获取所述测评语音集合对应的测评文本时，具体执行以下操作：获取所述测评语音集合对应的标准语音集合；基于标准语音信息与文本信息的对应关系，确定所述标准语音集合对应的测评文本。在一个实施例中，所述处理器1001在执行获取所述测评语音集合对应的标准语音集合，具体执行以下操作：在标准语音信息库中获取所述测评语音集合中各测评语音分别对应的标准语音；基于所述各测评语音的先后顺序，将所述各测评语音分别对应的标准语音组合为标准语音集合。在一个实施例中，所述处理器1001在执行在标准语音信息库中获取所述测评语音集合中各测评语音分别对应的标准语音，具体执行以下操作：在标准语音信息库中获取所述测评语音集合中的当前测评语音；获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合；基于所述相似度集合确定所述当前测评语音对应的标准语音；获取所述当前测评语音的下一个测评语音，将所述下一个测评语音确定为当前测评语音，并执行所述获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合的步骤；当检测到不存在下一个测评语音时，生成包含所述标准语音的标准语音集合。在一个实施例中，所述处理器1001在执行基于所述相似度集合确定所述当前测评语音对应的标准语音，具体执行以下操作：获取所述相似度集合中的相似度最大值；获取所述相似度最大值指示的目标标准语音曲线，将所述目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音。在一个实施例中，所述处理器1001在执行上述操作时，其特征在于所述差异文本信息包括差异文本数量、差异文本内容以及所述差异文本内容的属性。在一个或多个实施例中，用户终端采集所输入的测评语音集合，在标准语音信息库中获取所述测评语音集合中的当前测评语音，并获取所述当前测评语音对应的测评语音曲线，再将该测评语音曲线与标准语音曲线集合中各标准语音曲线进行比对，得到相似度集合，然后获取所述相似度集合中的相似度最大值指示的目标标准语音曲线，将该目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音，并按照相同的方式生成测评语音集合中其它测评语音对应的标准语音，将各测评语音对应的标准语音进行文本转化而得到测评文本，通过比较测评文本与样本文本而对测评语音集合进行评分。通过将所获取的测评文本与样本文本进行对比得到差异文本信息，然后根据所述差异文本信息进行评分，就可以实现对用户输入的语音测评集合进行准确评分，从而提高了语音评分的准确性。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。当前第1页1 2 3

技术特征：

1.一种评分生成方法，其特征在于，所述方法包括：

采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本；

将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息；

基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。

2.根据权利要求1所述的方法，其特征在于，所述获取所述测评语音集合对应的测评文本，包括：

获取所述测评语音集合对应的标准语音集合；

基于标准语音信息与文本信息的对应关系，确定所述标准语音集合对应的测评文本。

3.根据权利要求2所述的方法，其特征在于，所述获取所述测评语音集合对应的标准语音集合，包括：

在标准语音信息库中获取所述测评语音集合中各测评语音分别对应的标准语音；

基于所述各测评语音的先后顺序，将所述各测评语音分别对应的标准语音组合为标准语音集合。

4.根据权利要求3所述的方法，其特征在于，所述在标准语音信息库中获取所述测评语音集合中各测评语音分别对应的标准语音，包括：

在标准语音信息库中获取所述测评语音集合中的当前测评语音；

获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合；

基于所述相似度集合确定所述当前测评语音对应的标准语音；

获取所述当前测评语音的下一个测评语音，将所述下一个测评语音确定为当前测评语音，并执行所述获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合的步骤；

当检测到不存在下一个测评语音时，生成包含所述标准语音的标准语音集合。

5.根据权利要求4所述的方法，其特征在于，所述基于所述相似度集合确定所述当前测评语音对应的标准语音，包括：

获取所述相似度集合中的相似度最大值；

获取所述相似度最大值指示的目标标准语音曲线，将所述目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音。

6.根据权利要求1所述的方法，其特征在于，所述差异文本信息包括差异文本数量、差异文本内容以及所述差异文本内容的属性。

7.一种评分生成装置，其特征在于，所述装置包括：

文本获取模块，用于采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本；

信息获取模块，用于将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息；

评分生成模块，用于基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。

8.根据权利要求7所述的装置，其特征在于，所述集合获取模块，包括：

语音集合获取单元，用于获取所述测评语音集合对应的标准语音集合；

测评文本确定单元，用于基于标准语音信息与文本信息的对应关系，确定所述标准语音集合对应的测评文本。

9.根据权利要求8所述的装置，其特征在于，所述语音集合获取单元，具体用于：

在标准语音信息库中获取所述测评语音集合中各测评语音分别对应的标准语音；

基于所述各测评语音的先后顺序，将所述各测评语音分别对应的标准语音组合为标准语音集合。

10.根据权利要求9所述的装置，其特征在于，所述语音集合获取单元，具体用于：

在标准语音信息库中获取所述测评语音集合中的当前测评语音；

获取所述当前测评语音对应的测评语音曲线，获取所述测评语音曲线与标准语音曲线集合中各标准语音曲线的相似度集合；

基于所述相似度集合确定所述当前测评语音对应的标准语音；

当检测到不存在下一个测评语音时，生成包含所述标准语音的标准语音集合。

11.根据权利要求10所述的装置，其特征在于，所述语音集合获取单元，具体用于：

获取所述相似度集合中的相似度最大值；

获取所述相似度最大值指示的目标标准语音曲线，将所述目标标准语音曲线对应的目标标准语音确定为所述当前测评语音对应的标准语音。

12.根据权利要求7所述的装置，其特征在于，所述差异文本信息包括差异文本数量、差异文本内容以及所述差异文本内容的属性。

13.一种计算机存储介质，其特征在于，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行如权利要求1～6任意一项的方法步骤。

14.一种电子设备其特征在于，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1～6任意一项的方法步骤。

技术总结

本申请一个或多个实施例公开了一种评分生成方法、装置、存储介质及服务器，其中，方法包括：采集所输入的测评语音集合，获取所述测评语音集合对应的测评文本，将所述测评文本与样本文本进行比对，获取所述测评文本与所述样本文本之间的差异文本信息，基于所述差异文本信息对所述测评语音集合进行评分处理，生成所述测评语音集合对应的评分。采用本申请一个或多个实施例，可以提高语音评分的准确性。

技术研发人员：张岱;梁光;谭星;舒景辰;王正博

受保护的技术使用者：北京大米科技有限公司

技术研发日：.04.09

技术公布日：.08.16

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。