利索能及
我要发布
收藏
专利号: 2018114233560
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种音频处理方法,其特征在于,包括:

获取待处理的音频文件;

解析所述音频文件得到原始文本信息;所述原始文本信息中包括所述音频文件的词条文本以及播放所述词条文本中每句词条的播放时刻;

获取用户输入的待搜索文本,通过计算相似系数的方式,计算所述待搜索文本与所述词条文本中相似系数最高的部分,以在所述词条文本中确定与所述待搜索文本所匹配的目标词条,以及播放所述目标词条的目标播放时刻;

根据所述目标词条和所述目标播放时刻,播放与所述目标词条对应的音频;

所述获取用户输入的待搜索文本,通过计算相似系数的方式,计算所述待搜索文本与所述词条文本中相似系数最高的部分,以在所述词条文本中确定与所述待搜索文本所匹配的目标词条,以及播放所述目标词条的目标播放时刻,包括:获取用户输入的待搜索文本,并从所述待搜索文本中提取出至少一个关键词;

根据所述关键词在所述原始文本信息中进行模糊匹配,得到与所述待搜索文本所匹配的所述目标词条;

根据所述目标词条和所述原始文本信息中词条的播放时刻,确定所述目标词条的目标播放时刻;

所述根据所述关键词在所述原始文本信息中进行模糊匹配,得到与所述待搜索文本所匹配的所述目标词条,包括:根据所述关键词生成与所述关键词对应的第一词向量;

将所述原始文本信息划分成单句,并确定每个所述单句的第二词向量;

根据所述第一词向量和每个所述第二词向量,计算所述原始文本信息中的每句词条与所述关键词之间的单句匹配度;

识别所述单句匹配度最高的词条为所述目标词条;

根据关键词向量计算得到两者的单句匹配度为:

T

其中,a=(wa1,wa2,…,wai,…,wam) 用于表示待匹配文本所简化成的关键词构成的向T量;b=(wb1,wb2,…,wbi,…,wbm) 用于表示原始文本信息简化成的关键词所构成的向量。

2.如权利要求1所述的音频处理方法,其特征在于,所述获取用户输入的待搜索文本,并从所述待搜索文本中提取出至少一个关键词,包括:获取用户输入的待搜索文本,并对所述待搜索文本进行预处理,得到预处理之后的文本;

根据预先训练好的分词模型,对所述预处理之后的文本进行分词,得到至少一个所述关键词。

3.如权利要求1或2所述的音频处理方法,其特征在于,所述根据所述目标词条和所述目标播放时刻,播放与所述目标词条对应的音频之后,还包括:获取当前播放时刻所播放的目标音频,并识别所述目标音频的文本内容;

根据所述文本内容和所述当前播放时刻,纠正所述原始文本信息中记录的与所述文本内容匹配的目标词条文本所对应的目标播放时刻。

4.一种终端设备,其特征在于,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如下步骤:获取待处理的音频文件;

解析所述音频文件得到原始文本信息;所述原始文本信息中包括所述音频文件的词条文本以及播放所述词条文本中每句词条的播放时刻;

获取用户输入的待搜索文本,通过计算相似系数的方式,计算所述待搜索文本与所述词条文本中相似系数最高的部分,以在所述词条文本中确定与所述待搜索文本所匹配的目标词条,以及播放所述目标词条的目标播放时刻;

根据所述目标词条和所述目标播放时刻,播放与所述目标词条对应的音频;

所述获取用户输入的待搜索文本,通过计算相似系数的方式,计算所述待搜索文本与所述词条文本中相似系数最高的部分,以在所述词条文本中确定与所述待搜索文本所匹配的目标词条,以及播放所述目标词条的目标播放时刻,包括:获取用户输入的待搜索文本,并从所述待搜索文本中提取出至少一个关键词;

根据所述关键词在所述原始文本信息中进行模糊匹配,得到与所述待搜索文本所匹配的所述目标词条;

根据所述目标词条和所述原始文本信息中每句词条的播放时刻,确定所述目标词条的目标播放时刻;

所述根据所述关键词在所述原始文本信息中进行模糊匹配,得到与所述待搜索文本所匹配的所述目标词条,包括:根据所述关键词生成与所述关键词对应的第一词向量;

将所述原始文本信息划分成单句,并确定每个所述单句的第二词向量;

根据所述第一词向量和每个所述第二词向量,计算所述原始文本信息中的每句词条与所述关键词之间的单句匹配度;

识别所述单句匹配度最高的词条为所述目标词条;

根据关键词向量计算得到两者的单句匹配度为:

T

其中,a=(wa1,wa2,…,wai,…,wam) 用于表示待匹配文本所简化成的关键词构成的向T量;b=(wb1,wb2,…,wbi,…,wbm) 用于表示原始文本信息简化成的关键词所构成的向量。

5.如权利要求4所述的终端设备,其特征在于,所述获取用户输入的待搜索文本,并从所述待搜索文本中提取出至少一个关键词,包括:获取用户输入的待搜索文本,并对所述待搜索文本进行预处理,得到预处理之后的文本;

根据预先训练好的分词模型,对所述预处理之后的文本进行分词,得到至少一个所述关键词。

6.一种终端设备,其特征在于,包括:

获取单元,用于获取待处理的音频文件;

解析单元,用于解析所述音频文件得到原始文本信息;所述原始文本信息中包括所述音频文件的词条文本以及播放所述词条文本中每句词条的播放时刻;

匹配单元,用于获取用户输入的待搜索文本,通过计算相似系数的方式,计算所述待搜索文本与所述词条文本中相似系数最高的部分,以在所述词条文本中确定与所述待搜索文本所匹配的目标词条,以及播放所述目标词条的目标播放时刻;

播放单元,用于根据所述目标词条和所述目标播放时刻,播放与所述目标词条对应的音频;

所述匹配单元包括:

提取单元,用于获取用户输入的待搜索文本,并从所述待搜索文本中提取出至少一个关键词;

搜索单元,用于根据所述关键词在所述原始文本信息中进行模糊匹配,得到与所述待搜索文本所匹配的所述目标词条;

确定单元,用于根据所述目标词条和所述原始文本信息中每句词条的播放时刻,确定所述目标词条的目标播放时刻;

所述搜索单元包括:

第一向量单元,用于根据所述关键词生成与所述关键词对应的第一词向量;

第二向量单元,用于将所述原始文本信息划分成单句,并确定每个所述单句的第二词向量;

计算单元,用于根据所述第一词向量和每个所述第二词向量,计算所述原始文本信息中的每句词条与所述关键词之间的单句匹配度;

识别单元,用于识别所述单句匹配度最高的词条为所述目标词条;

根据关键词向量计算得到两者的单句匹配度为:

T

其中,a=(wa1,wa2,…,wai,…,wam) 用于表示待匹配文本所简化成的关键词构成的向T量;b=(wb1,wb2,…,wbi,…,wbm) 用于表示原始文本信息简化成的关键词所构成的向量。

7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述方法的步骤。