第一句子网 - 唯美句子、句子迷、好句子大全
第一句子网 > 一种音频数据的处理方法 装置及移动终端与流程

一种音频数据的处理方法 装置及移动终端与流程

时间:2020-05-10 12:06:32

相关推荐

一种音频数据的处理方法 装置及移动终端与流程

本申请涉及计算机技术领域,尤其涉及一种音频数据的处理方法、装置及移动终端。

背景技术:

随着移动终端的迅速普及,以手机为主的移动终端已经成为人们生活和工作的必需品,然而使用率较高的手机品牌和型号较为单一,手机铃声的差别较小,这就导致在人群密集的场所会常出现“混淆”的情况,为此,人们通常可以通过定制铃声的方式设定自己的手机铃声,以与其他手机铃声进行区分。

目前,大多数的手机会提供一定数量的铃声供用户选择使用,同时用户也可以将下载的音频数据作为手机铃声。由于用户往往不喜欢或不常使用手机中提供的铃声,而将下载的音频数据作为手机铃声,其时长较长,为此,用户会通过手工截取的方式从中截取一段音频数据作为手机铃声,例如某一首歌曲的高潮片段等。

但是,在通过手工截取音频数据的过程中,用户需要打开音频数据,一边浏览音频数据,一边通过手工不断调整的方式选择需要的片段(如高潮片段等),从而导致用户在处理音频数据的过程中会消耗大量的时间成本,音频数据的处理效率低下,用户体验较差。

技术实现要素:

本申请实施例的目的是提供一种音频数据的处理方法、装置及移动终端,以解决现有技术中用户在处理音频数据的过程中时间成本消耗大,用户体验较差的问题。

为解决上述技术问题,本申请实施例是这样实现的:

第一方面,本申请实施例提供的一种音频数据的处理方法,所述方法包括:

获取待设置为铃声的音频数据;

如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态;

基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。可选地,所述基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据,包括:

接收对所述音频数据的编辑指令;根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区;

根据所述音频峰值区,从所述音频数据中截取待推荐音频数据。

可选地,所述根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区,包括:

将所述音频数据划分为多段,得到多段子音频数据;

分别从每一段子音频数据中确定候选峰值区,所述候选峰值区中包含的音量值和音频信息对应的音频值均大于预定选取阈值,且所述候选峰值区的时长大于预定时长阈值;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

可选地,所述根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区,包括:

将所述音频数据划分为多段,得到多段子音频数据;

分别获取每一段子音频数据的音量信息对应的音量值和音频信息对应的音频数值的总和;

根据每一段子音频数据对应的总和的数值大小,从所述多段子音频数据中选取满足预定段数条件的子音频数据作为所述候选峰值区;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

可选地,所述从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区,包括:

如果所述候选峰值区中的每个候选峰值区的时长处于预定时长范围内,则从所述候选峰值区中,获取时长处于预定时长范围内的候选峰值区作为所述音频峰值区。

如果所述候选峰值区中的每个候选峰值区的时长未处于预定时长范围内,则从所述候选峰值区中,获取总时长处于预定时长范围内的相邻的多个候选峰值区作为所述音频峰值区。

第二方面,本申请实施例提供了一种音频数据的处理装置,所述装置包括:

音频获取模块,用于获取待设置为铃声的音频数据;

编辑模块,用于如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态;

截取模块,用于基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。

可选地,所述截取模块,包括:

接收单元,用于接收对所述音频数据的编辑指令;

提取单元,用于根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区;

截取单元,用于根据所述音频峰值区,从所述音频数据中截取待推荐音频数据。

可选地,所述提取单元,用于:

将所述音频数据划分为多段,得到多段子音频数据;

分别从每一段子音频数据中确定候选峰值区,所述候选峰值区中包含的音量值和音频信息对应的音频值均大于预定选取阈值,且所述候选峰值区的时长大于预定时长阈值;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

可选地,所述提取单元,包括:

将所述音频数据划分为多段,得到多段子音频数据;

分别获取每一段子音频数据的音量值和音频信息对应的音频数值的总和;

根据每一段子音频数据对应的总和的数值大小,从所述多段子音频数据中选取满足预定段数条件的子音频数据作为所述候选峰值区;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

可选地,所述从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区,用于:

,如果所述候选峰值区中的每个候选峰值区的时长处于预定时长范围内,则从所述候选峰值区中,获取时长处于预定时长范围内的候选峰值区作为所述音频峰值区。

如果所述候选峰值区中的每个候选峰值区的时长未处于预定时长范围内,则从所述候选峰值区中,获取总时长处于预定时长范围内的相邻的多个候选峰值区作为所述音频峰值区。

第三方面,本申请实施例提供一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述实施例提供的音频数据的处理方法的步骤。

第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的音频数据的处理方法的步骤。

由以上本申请实施例提供的技术方案可见,本申请实施例通过获取待设置为铃声的音频数据,如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态,然后基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。这样,用户在进行音频数据的处理过程中,不需要在浏览音频数据的同时,使用手工不断调整的方式选择需要的片段,提高了音频数据的处理效率,改善了用户体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一种音频数据的处理方法实施例的流程图;

图2为本申请另一种音频数据的处理方法实施例的流程图;

图3为本申请一种用户对音频数据的位置选择操作的显示示意图;

图4为本申请又一种音频数据的处理方法实施例的流程图;

图5为本申请一种音频数据的处理的装置的结构示意图;

图6为本申请一种移动终端的结构示意图。

具体实施方式

本申请实施例提供一种音频数据的处理方法、装置及移动终端。

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

实施例一

如图1所示,本申请实施例提供一种音频数据的处理方法,该方法的执行主体可以为移动终端,其中,该移动终端可以如手机、平板电脑等,该移动终端可以为用户使用的移动终端。该方法可以在获取音频数据后,根据音频数据的音量信息和音频信息,自动提取出音频峰值区,并推荐给用户。该方法具体可以包括以下步骤:

在步骤S102中,获取待设置为铃声的音频数据。

其中,待截设置为铃声的音频数据可以是任意音频数据,例如用户在移动终端内存储的音频数据,或是,用户在线获取的音频数据,再或者,可以是用户在移动终端内存储或是在线获取的视频数据中的音频数据等。

在实施中,移动互联网的发展,推动了移动终端的普及使用,以手机为主的移动终端已经成为人们生活和工作的必需品,但是在移动终端市场上,使用率较高的手机品牌和型号较为集中,同时手机在出厂时,厂家通常会在手机中存储一定数量的铃声供用户选择使用,这就导致使用同一品牌、同一型号手机的用户在铃声上的选择较少,同一款铃声会有很多人使用,所以在人群集中的地方,当铃声响起时,可能会造成“混乱”的场面。除了手机中自带的备选铃声外,用户可以通过截取音频数据中的部分音频数据来用作手机的铃声,以与其他用户进行区别。但是在截取的过程中,用户需要对音频数据进行全部的浏览,以精确的定位到需截取的高潮部分,在此过程中,有时需要多次反复的操作,才能准确的找到需要的部分,这就给用户带来了较高的时间成本,造成用户体验较差。为此,本发明实施例提供一种能够解决上述问题的技术方案,具体可以参见下述内容。

以用户通过在线获取音频数据作为手机铃声为例,用户可以通过移动终端上安装的音频播放软件,选取自己喜欢的音频数据,并下载到移动终端中,并可以将其作为待设置为铃声的音频数据。另外,用户还可以对该音频数据进行编辑,可将编辑后的音频数据作为获取的待设置为铃声的音频数据。

在实际应用中,下载的音频数据中有些音频数据可以被直接作为手机铃声,为此,还可以设置一个选取条件,例如,可以设定一个铃声时长要求,如铃声时长范围为40秒钟~1分钟等,基于此,如果下载的音频数据时长不满足铃声时长要求,则可以直接将其作为获取的待设置为铃声的音频数据。如果下载的音频数据时长满足铃声时长要求,则可以将该音频数据直接作为铃声。

上述实施例是以用户通过在线下载的方式获取待设置为铃声的音频数据,在实际应用中,还可以包括其他情况,例如,用户在手机等移动终端中存储的音频数据,或者,用户通过移动终端录制的音频数据等,上述获取的音频数据都可以作为获取的待设置为铃声的音频数据。

在步骤S104中,如果音频数据的时长大于预定时长阈值,且不存在基于音频数据设置铃声的历史信息,则将音频数据设置为可编辑状态。

其中,预定时长阈值可以是任意时长,例如20秒,30秒。可编辑状态可以通过编辑按钮的颜色提现出来,例如,如果音频数据为可编辑状态,则该音频数据对应的编辑按钮可以设置为高亮状态,如果不可编辑,可将编辑按钮的颜色设为灰色。

如果待设置为铃声的音频数据的时长大于预定的时长阈值,则对铃声设置的历史信息进行查找,如果不存在该音频数据设置为铃声的历史信息,则可将该音频数据设置为可编辑状态。例如,预定的时长阈值为30秒,待设置为铃声的音频数据的时长为1分钟,该音频数据的时长大于预定的时长阈值,且该音频数据也未做过铃声,也不存在基于该音频数据设置铃声的历史信息,所以可以将该音频数据设置为可编辑状态,可以在该音频数据的旁边添加编辑按钮,并做高亮处理。

在步骤S106中,基于对音频数据的编辑操作,从音频数据中截取待推荐音频数据。

其中,编辑操作可以是对对音频数据中部分数据的截取,也可以是对音频数据中部分组合数据的选取,例如,截取出音频数据中某一段的高潮部分,或者是对音频数据中某两段高潮部分的组合,具体的编辑操作可以根据实际的应用情况而不同。

在实施中,可以对音频数据进行编辑操作,截取出音频数据中的中间部分,作为待推荐音频数据,例如,如果一段音频数据为3分钟,则可以将中间的30秒,即从1分15秒到1分45秒的部分截取出来,作为待推荐的音频数据。

此外,也可以根据预设的选取规则对音频数据进行编辑操作,例如,预设的选取规则是根据音频数据所述类型获取不同时段的数据,如果音频数据属于时长在1分钟到3分钟的歌曲类,则获取该音频数据的中间30秒数据作为待推荐音频数据,如果音频数据属于时长在30秒到1分钟的短音乐,则将该短音乐直接作为待推荐音频数据,如果音频数据属于大于3分钟的长音频数据,则可选择在3分到3分30秒的数据作为待推荐音频数据,并可以接收用户对待推荐音频数据时长的调整操作。

上述实施例提供的是可选地、可实现的对音频数据的编辑操作,具体的编辑操作方法可以是多种多样的,本实施例对此并不做限定。

本申请实施例提供一种音频数据的处理方法,通过获取待设置为铃声的音频数据,如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态,然后基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。这样,用户在进行音频数据的处理过程中,不需要在浏览音频数据的同时,使用手工不断调整的方式选择需要的片段,提高了音频数据的处理效率,改善了用户体验。

实施例二

如图2所示,本申请实施例提供一种音频数据的处理方法,该方法的执行主体可以为移动终端,其中,该移动终端可以如手机、平板电脑等,该移动终端可以为用户使用的移动终端。该方法可以在获取音频数据后,根据音频数据的音量信息和音频信息,自动提取出音频峰值区,并推荐给用户。该方法具体可以包括以下步骤:

在步骤S202中,获取待设置为铃声的音频数据。

上述S202的具体处理过程可以参见上述实施例一中S102的相关内容,在此不再赘述。

在步骤S204中,如果音频数据的时长大于预定时长阈值,且不存在基于音频数据设置铃声的历史信息,则将音频数据设置为可编辑状态。

上述S204的具体处理过程可以参见上述实施例一中S104的相关内容,在此不再赘述。

在步骤S206中,接收对音频数据的编辑指令。

其中,编辑指令可以是用户在编辑按钮上的点选操作,也可以是对该音频数据的点选操作。

在实施中,经过步骤S204将该音频数据设置为可编辑状态后,可在该音频数据后设置一个编辑按钮,可以接收用户在该编辑按钮上的点选操作,即为对该音频数据的编辑指令。还可以接收对该音频数据的长按、双击或点选操作,作为对该音频数据的编辑指令。

在实际应用中,如果移动终端中存储有预先设定的常用的音频数据的截取方案,则可以依据常用的音频数据的截取方案对该音频数据进行相应的编辑操作,最终从该音频数据中截取待推荐音频数据,具体可以参见常用处理方式,在此不再赘述。如果移动终端中未存储有预先设定的常用的音频数据的截取方案,则移动终端可以根据该音频数据的音量信息和音频信息,从该音频数据中提取音频峰值区,并根据该音频峰值区,从该音频数据中截取待推荐音频数据,具体处理方式可以包括多种多样,以下提供一种可选的处理方式,具体可以参见下述相关内容。

在步骤S208中,将音频数据划分为多段,得到多段子音频数据。

在实施中,可以根据预定的时间间隔,将音频数据划分为多段,其中,预定的时间间隔可以是任意大小,也可以是与铃声时长相关的时间长度,其中,铃声时长可以是移动终端在收到来电或短信等提示时,播放音频的时间,通常情况下铃声时长可以是20秒,或者30-45秒,具体应用情况因应用场景不同而有多不同,本申请对此不做限定。根据该时间间隔将音频数据划分为多个相同时长的子音频数据。预定的时间间隔可以与铃声时长相同,或是小于铃声时长,本申请实施例对此不做限定。根据预定的时间间隔,对获取的音频数据进行分段,例如,可以将约定的时间间隔设定为15秒,如果获取的音频数据总长为3分钟,则可以将其分为12段等时长的音频区域段。也可以根据音频数据的时长,确定时间间隔,例如,如果获取的音频数据总长是3分05秒,则可以将划分的时间间隔设定为5秒或是37秒,由此来获得等时间长度的多段子音频数据。

在步骤S210中,分别从每一段子音频数据中确定候选峰值区,候选峰值区中包含的音量值和音频信息对应的音频值均大于预定选取阈值,且候选峰值区的时长大于预定时长阈值。

其中,音频数据中的音量信息和音频信息可以是包含音频的音调、音强和音色等参数信息。音频峰值区可以是音频数据中,音量信息和音频信息的数值较大的区域(如超过某预定阈值的区域等)。

音量值和音频信息对应的音频值可以是记录音频特征的数据,例如,可以是决定音量值的振幅数值,以及可以决定音频信息的频率数值等。预定选取阈值可以根据音频数据总的音量值和音频值确定,例如,一段时长为3分钟的音频数据总的音量值是600分贝,该音频数据被分为12段等时间长度的子音频数据,则平均每一段子音频数据的音量值应为50分贝,那么预定选取阈值可以是50分贝,或者高于平均值的60分贝等。预定时长阈值可以是小于每一段子音频数据时长的任意时长,如3秒钟或5秒钟等。

在实施中,由步骤S208得到划分后的子音频数据,可以分别对每个子音频数据中所包含的音量值和音频信息对应的音频值进行计算,如果得到的数值均大于预定选取阈值,同时该子音频数据的时长也大于预定时长阈值,则可以将其确定为候选峰值区。

例如,如果将预定选取阈值设定为音量值为50分贝,音频信息对应的音频值为100赫兹,即所确定的候选峰值区的音量值和音频信息对应的音频值应分别大于50分贝和100赫兹。如果一段时长为3分钟的音频数据被划分为12段子音频数据,每个子音频数据的时长都为15秒,在这12段子音频数据中,有一段自音频数据中包含有一段时长为11秒的音频数据段,其中该音频数据段中所有点的音量值都大于50分贝,所有点的音频值都大于100赫兹,同时该音频数据段的时长也大于预定时长阈值10秒,则该音频数据段可以确定为候选峰值区。如果这12段子音频数据中,有多个子音频数据都包含有满足上述条件的音频数据段,则可以将这些满足预定选取阈值和预定时长阈值的音频数据段确定为候选峰值区。

在步骤S212中,从候选峰值区中提取满足预定时长范围条件的候选峰值区作为音频峰值区。

其中,预定时长范围条件可以是满足手机铃声时长要求的任意时间范围,例如可以是大于10秒且小于20秒,或是最接近20秒。具体情况可以根据应用场景进行调整,本申请实施例对此不做具体的要求。

在实施中,由步骤S206中得到的候选峰值区中,找到满足预定时长范围条件的候选峰值区,将该候选峰值区提取出来,作为音频峰值区。例如,预定时长范围条件可以设定为大于10秒且最接近20秒的音频区,如果存在多个时长不同的候选峰值区,可以将上述候选峰值区中大于10秒的候选峰值区提取出来,在进行对比,找到最接近20秒的一个或多个候选峰值区,将上述候选峰值区提取出来作为音频峰值区。

在步骤S214中,如果候选峰值区中的每个候选峰值区的时长处于预定时长范围内,则从候选峰值区中,获取时长处于预定时长范围内的候选峰值区作为音频峰值区。

在实施中,如果预定时长范围设定为大于10秒且小于20秒,则可以将满足该预定时长范围的一个或多个候选峰值区提取出来作为音频峰值区。

在步骤S216中,如果候选峰值区中的每个候选峰值区的时长未处于预定时长范围内,则从候选峰值区中,获取总时长处于预定时长范围内的相邻的多个候选峰值区作为音频峰值区。

在实施中,如果候选峰值区的时长都不满足预定时长范围,则可以获取总时长处于预定时长范围内的相邻多个候选峰值区作为音频峰值区。例如,预定时长范围如果设定为10-20秒,候选峰值区的时长都小于10秒,如果一段候选峰值区的时长为8秒,其相邻的候选峰值区的时长为9秒,两段候选峰值区之间的间隔为2秒,则这两段候选峰值区的组合时长为19秒,满足预定时长范围,即10-20秒,则该这两段候选峰值区的组合就可以作为音频峰值区。如果存在多个相邻候选峰值区,其组合后的区域能满足预定时长范围,也可以将其作为音频峰值区。

在步骤S218中,根据音频峰值区,从上述音频数据中截取待推荐音频数据。

在实施中,由步骤S212得到音频峰值区后,可以根据音频峰值区的起始位置和结束位置,在音频数据中查找到相应的时间点,然后,可以基于查找到的时间点对音频数据进行截取,可以将截取的结果显示在移动终端中,供用户查看。

此外,根据音频峰值区,可以在音频数据播放的时间进度条上突出显示音频峰值区对应的时间段。

例如,一段时长为3分钟的音频数据,需截取的音频峰值区的起始时间点是1分50秒,结束的时间点是2分03秒,则可以在该音频播放的时间进度条上突出显示1分50秒到2分03秒的时间区域,可以使用不同的颜色显示或是加粗显示,同时标注出1分50秒和2分03秒的位置。如果存在多个音频峰值区,则可以在时间进度条上采用不同的颜色进行标注,或者可以在每个音频峰值区对应的时间段上进行标号,以示区分。对于获取的音频峰值区,用户可以根据其需求对其进行调整,例如,如果该音频数据是一首歌曲,截取的音频峰值区可以是该歌曲的高潮部分,如果截取的音频峰值区在起始点之前还包括高潮部分的个别歌词,则用户可以在时间进度条上向左拖动音频峰值区对应的时间段的起始点,将被截掉的歌词截取进音频峰值区,或是向右音频峰值区对应的时间段的结束点,将被截掉的歌词截取进音频峰值区,如图3所示。本申请实施例提供一种音频数据的处理方法,通过获取待设置为铃声的音频数据,如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态,然后基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。这样,用户在进行音频数据的处理过程中,不需要在浏览音频数据的同时,使用手工不断调整的方式选择需要的片段,提高了音频数据的处理效率,改善了用户体验。

实施例三

如图4所示,本申请实施例提供一种音频数据的处理方法,该方法的执行主体可以为移动终端,其中,该移动终端可以如手机、平板电脑等,该移动终端可以为用户使用的移动终端。该方法可以在获取音频数据后,根据音频数据的音量信息和音频信息,自动提取出音频峰值区,并推荐给用户。该方法具体可以包括以下步骤:

在步骤S402中,获取待设置为铃声的音频数据。

上述S402的具体处理过程可以参见上述实施例一中S102的相关内容,在此不再赘述。

在步骤S404中,如果音频数据的时长大于预定时长阈值,且不存在基于音频数据设置铃声的历史信息,则将音频数据设置为可编辑状态。

上述S404的具体处理过程可以参见上述实施例一中S104的相关内容,在此不再赘述。

在步骤S406中,接收对音频数据的编辑指令。

上述S406的具体处理过程可以参见上述实施例二中S206的相关内容,在此不再赘述。

在实际应用中,如果移动终端中存储有预先设定的常用的音频数据的截取方案,则可以依据常用的音频数据的截取方案对该音频数据进行相应的编辑操作,最终从该音频数据中截取待推荐音频数据,具体可以参见常用处理方式,在此不再赘述。如果移动终端中未存储有预先设定的常用的音频数据的截取方案,则移动终端可以根据该音频数据的音量信息和音频信息,从该音频数据中提取音频峰值区,并根据该音频峰值区,从该音频数据中截取待推荐音频数据,具体处理方式可以包括多种多样,以下提供一种可选的处理方式,具体可以参见下述相关内容。

在步骤S408中,将音频数据划分为多段,得到多段子音频数据。

上述S408的具体处理过程可以参见上述实施例二中S208的相关内容,在此不再赘述。

在步骤S410中,分别获取每一段子音频数据的音量值和音频信息对应的音频数值的总和。

其中,音量信息对应的音量值和音频信息对应的音频数据可以是音量值(如分贝数)和音频数值的总和。

在实施中,分别获取每一段子音频数据中的音量值和音频信息对应的音频数值,并进行汇总,例如,一段子音频数据中的所有点的音量值的总和可以是500分贝,所有音频数值的总和可以是600赫兹。

在步骤S412中,根据每一段子音频数据对应的总和的数值大小,从所述多段子音频数据中选取满足预定段数条件的子音频数据作为所述候选峰值区。

其中,预定段数条件可以是一段或多段,具体设定可以根据音频数据的时间长度或是音频数据中高潮部分出现的次数决定。

在实施中,根据步骤S406分别得到每一段子音频数据的音量值和音频数值的总和,以此作为依据,对子音频数据进行综合排序,可以根据音量值和音频数值总和的大小进行排序,如果预定段数设定为2段,则可以将音量值和音频数值总和排名前两位的子音频数据作为候选峰值区。

在步骤S414中,从候选峰值区中提取满足预定时长范围条件的候选峰值区作为音频峰值区。

上述S414的具体处理过程可以参见上述实施例二中S212的相关内容,在此不再赘述。

在步骤S416中,如果候选峰值区中的每个候选峰值区的时长处于预定时长范围内,则从候选峰值区中,获取时长处于预定时长范围内的候选峰值区作为音频峰值区。

上述S416的具体处理过程可以参见上述实施例二中S214的相关内容,在此不再赘述。

在步骤S418中,如果候选峰值区中的每个候选峰值区的时长未处于预定时长范围内,则从候选峰值区中,获取总时长处于预定时长范围内的相邻的多个候选峰值区作为音频峰值区。

上述S418的具体处理过程可以参见上述实施例二中S216的相关内容,在此不再赘述。

在步骤S420中,根据音频峰值区,从音频数据中截取待推荐音频数据。

上述S420的具体处理过程可以参见上述实施例二中S218的相关内容,在此不再赘述。

本申请实施例提供了一种音频数据的处理方法,通过获取待设置为铃声的音频数据,如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态,然后基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。这样,用户在进行音频数据的处理过程中,不需要在浏览音频数据的同时,使用手工不断调整的方式选择需要的片段,提高了音频数据的处理效率,改善了用户体验。

实施例四

以上为本申请实施例提供的音频数据的处理方法,基于同样的思路,本申请实施例还提供一种音频数据的处理装置,如图5所示。

该音频数据的处理装置包括:音频获取模块501、编辑模块502和截取模块503,其中:

音频获取模块501,用于获取待设置为铃声的音频数据;

编辑模块502,用于如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态;

截取模块503,用于基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。

本申请实施例中,所述截取模块503,包括:

接收单元,用于接收对所述音频数据的编辑指令;

提取单元,用于根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区;

截取单元,用于根据所述音频峰值区,从所述音频数据中截取待推荐音频数据。

本申请实施例中,所述提取单元,包括:

将所述音频数据划分为多段,得到多段子音频数据;

分别从每一段子音频数据中确定候选峰值区,所述候选峰值区中包含的音量值和音频信息对应的音频值均大于预定选取阈值,且所述候选峰值区的时长大于预定时长阈值;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

本申请实施例中,所述提取单元,包括:

将所述音频数据划分为多段,得到多段子音频数据;

分别获取每一段子音频数据的音量值和音频信息对应的音频数值的总和;

根据每一段子音频数据对应的总和的数值大小,从所述多段子音频数据中选取满足预定段数条件的子音频数据作为所述候选峰值区;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

在本申请实施例中,所述提取单元,用于:

如果所述候选峰值区中的每个候选峰值区的时长处于预定时长范围内,则从所述候选峰值区中,获取时长处于预定时长范围内的候选峰值区作为所述音频峰值区。

如果所述候选峰值区中的每个候选峰值区的时长未处于预定时长范围内,则从所述候选峰值区中,获取总时长处于预定时长范围内的相邻的多个候选峰值区作为所述音频峰值区。

本申请实施例提供了一种音频数据的处理装置,通过获取待设置为铃声的音频数据,如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态,然后基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。这样,用户在进行音频数据的处理过程中,不需要在浏览音频数据的同时,使用手工不断调整的方式选择需要的片段,提高了音频数据的处理效率,改善了用户体验。

实施例五

图6为实现本发明各个实施例的一种移动终端的硬件结构示意图,

该移动终端600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解,图6中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中,处理器610,用于获取待设置为铃声的音频数据;

处理器610,用于如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态;

处理器610,用于基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。

此外,处理器610,还用于接收对所述音频数据的编辑指令;处理器610,还用于根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区;

处理器610,还用于根据所述音频峰值区,从所述音频数据中截取待推荐音频数据。

此外,处理器610,还用于将所述音频数据划分为多段,得到多段子音频数据;分别从每一段子音频数据中确定候选峰值区,所述候选峰值区中包含的音量值和音频信息对应的音频值均大于预定选取阈值,且所述候选峰值区的时长大于预定时长阈值;从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

另外,所述处理器610,还用于将所述音频数据划分为多段,得到多段子音频数据;分别获取每一段子音频数据的音量值和音频信息对应的音频数值的总和;根据每一段子音频数据对应的总和的数值大小,从所述多段子音频数据中选取满足预定段数条件的子音频数据作为所述候选峰值区;从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

此外,所述处理器610,还用于如果所述候选峰值区中的每个候选峰值区的时长处于预定时长范围内,则从所述候选峰值区中,获取时长处于预定时长范围内的候选峰值区作为所述音频峰值区。

另外,所述处理器610,还用于如果所述候选峰值区中的每个候选峰值区的时长未处于预定时长范围内,则从所述候选峰值区中,获取总时长处于预定时长范围内的相邻的多个候选峰值区作为所述音频峰值区。

本申请实施例提供一种移动终端,通过获取待设置为铃声的音频数据,如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态,然后基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。这样,用户在进行音频数据的处理过程中,不需要在浏览音频数据的同时,使用手工不断调整的方式选择需要的片段,提高了音频数据的处理效率,改善了用户体验。

应理解的是,本申请实施例中,射频单元601可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器610处理;另外,将上行的数据发送给基站。通常,射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元601还可以通过无线通信系统与网络和其他设备通信。

移动终端通过网络模块602为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元603还可以提供与移动终端600执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。

输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(Graphic秒Proce秒秒ing Unit,GPU)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。

移动终端600还包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度,接近传感器可在移动终端600移动到耳边时,关闭显示面板6061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。

显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061,可以采用液晶显示器(Liquid Cry秒tal Di秒play,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板6061。

用户输入单元607可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器610,接收处理器610发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071,用户输入单元607还可以包括其他输入设备6072。具体地,其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。

进一步的,触控面板6071可覆盖在显示面板6061上,当触控面板6071检测到在其上或附近的触摸操作后,传送给处理器610以确定触摸事件的类型,随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。虽然在图6中,触控面板6071与显示面板6061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板6071与显示面板6061集成而实现移动终端的输入和输出功能,具体此处不做限定。

接口单元608为外部装置与移动终端600连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端600内的一个或多个元件或者可以用于在移动终端600和外部装置之间传输数据。

存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器609可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器610是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器609内的软件程序和/或模块,以及调用存储在存储器609内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器610可包括一个或多个处理单元;优选的,处理器610可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。

移动终端600还可以包括给各个部件供电的电源611(比如电池),优选的,电源611可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

优选的,本发明实施例还提供一种移动终端,包括处理器610,存储器609,存储在存储器609上并可在所述处理器610上运行的计算机程序,该计算机程序被处理器610执行时实现上述音频数据的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

实施例六

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述音频数据的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Acce秒秒Memory,简称RAM)、磁碟或者光盘等。

本申请实施例提供一种计算机可读存储介质,通过获取待设置为铃声的音频数据,如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态,然后基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。这样,用户在进行音频数据的处理过程中,不需要在浏览音频数据的同时,使用手工不断调整的方式选择需要的片段,提高了音频数据的处理效率,改善了用户体验。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(fla秒hRAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(秒RAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(tran秒itory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

技术特征:

1.一种音频数据的处理方法,其特征在于,所述方法包括:

获取待设置为铃声的音频数据;

如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态;

基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。

2.根据权利要求1所述的方法,其特征在于,所述基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据,包括:

接收对所述音频数据的编辑指令;

根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区;

根据所述音频峰值区,从所述音频数据中截取待推荐音频数据。

3.根据权利要求2所述的方法,特征在于,所述根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区,包括:

将所述音频数据划分为多段,得到多段子音频数据;

分别从每一段子音频数据中确定候选峰值区,所述候选峰值区中包含的音量值和音频信息对应的音频值均大于预定选取阈值,且所述候选峰值区的时长大于预定时长阈值;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

4.根据权利要求2所述的方法,特征在于,所述根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区,包括:

将所述音频数据划分为多段,得到多段子音频数据;

分别获取每一段子音频数据的音量值和音频信息对应的音频数值的总和;

根据每一段子音频数据对应的总和的数值大小,从所述多段子音频数据中选取满足预定段数条件的子音频数据作为所述候选峰值区;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

5.根据权利要求3或4所述的方法,特征在于,所述从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区,包括:

如果所述候选峰值区中的每个候选峰值区的时长处于预定时长范围内,则从所述候选峰值区中,获取时长处于预定时长范围内的候选峰值区作为所述音频峰值区;

如果所述候选峰值区中的每个候选峰值区的时长未处于预定时长范围内,则从所述候选峰值区中,获取总时长处于预定时长范围内的相邻的多个候选峰值区作为所述音频峰值区。

6.一种音频数据的处理装置,其特征在于,所述装置包括:

音频获取模块,用于获取待设置为铃声的音频数据;

编辑模块,用于如果所述音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态;

截取模块,用于基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。

7.根据权利要求6所述的装置,特征在于,所述截取模块,包括:

接收单元,用于接收对所述音频数据的编辑指令;

提取单元,用于根据所述音频数据的音量信息和音频信息,从所述音频数据中提取音频峰值区;

截取单元,用于根据所述音频峰值区,从所述音频数据中截取待推荐音频数据。

8.根据权利要求7所述的装置,特征在于,所述提取单元,用于:

将所述音频数据划分为多段,得到多段子音频数据;

分别从每一段子音频数据中确定候选峰值区,所述候选峰值区中包含的音量值和音频信息对应的音频值均大于预定选取阈值,且所述候选峰值区的时长大于预定时长阈值;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

9.根据权利要求7所述的装置,特征在于,所述提取单元,用于:

将所述音频数据划分为多段,得到多段子音频数据;

分别获取每一段子音频数据的音量值和音频信息对应的音频数值的总和;

根据每一段子音频数据对应的总和的数值大小,从所述多段子音频数据中选取满足预定段数条件的子音频数据作为所述候选峰值区;

从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区。

10.根据权利要求8或9所述的装置,特征在于,所述从所述候选峰值区中提取满足预定时长范围条件的候选峰值区作为所述音频峰值区,用于:

如果所述候选峰值区中的每个候选峰值区的时长处于预定时长范围内,则从所述候选峰值区中,获取时长处于预定时长范围内的候选峰值区作为所述音频峰值区;

如果所述候选峰值区中的每个候选峰值区的时长未处于预定时长范围内,则从所述候选峰值区中,获取总时长处于预定时长范围内的相邻的多个候选峰值区作为所述音频峰值区。

11.一种移动终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的音频数据的处理方法的步骤。

技术总结

本申请实施例公开了一种音频数据的处理方法、装置及移动终端,所述方法包括:获取待设置为铃声的音频数据,如果所述目标音频数据的时长大于预定时长阈值,且不存在基于所述音频数据设置铃声的历史信息,则将所述音频数据设置为可编辑状态,基于对所述音频数据的编辑操作,从所述音频数据中截取待推荐音频数据。通过本方法,可以提高音频数据的处理效率,提高用户体验。

技术研发人员:彭林峰

受保护的技术使用者:维沃移动通信有限公司

技术研发日:.09.20

技术公布日:.01.01

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。