利索能及
我要发布
收藏
专利号: 201810416166X
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种推送消息播报方法,其特征在于,包括:接收消息推送服务器下发的推送消息;

采集预设的时间段内的语音信息;

判断所述语音信息中是否包含用于指示播报所述推送消息的预设指令;

若所述语音信息中包含用于指示播报所述推送消息的预设指令,则提取所述语音信息中的声纹特征向量;

计算所述语音信息中的声纹特征向量与预设的基准声纹特征向量之间的匹配度,所述基准声纹特征向量为从指定用户的语音中提取的声纹特征向量;

若所述语音信息中的声纹特征向量与所述基准声纹特征向量之间的匹配度大于预设的匹配度阈值,则以语音形式播报所述推送消息;

所述计算所述语音信息中的声纹特征向量与预设的基准声纹特征向量之间的匹配度包括:

根据下式计算所述语音信息中的声纹特征向量与所述基准声纹特征向量之间的匹配度:

其中,n为梅尔频谱倒频系数的序号,1≤n≤N,N为梅尔频谱倒频系数向量的预设维度,StVpElemn为所述基准声纹特征向量的第n个元素,VpElemn为所述语音信息中的声纹特征向量的第n个元素,MatDeg为所述语音信息中的声纹特征向量与所述基准声纹特征向量之间的匹配度。

2.根据权利要求1所述的推送消息播报方法,其特征在于,所述提取所述语音信息中的声纹特征向量包括:

将所述语音信息划分为M个语音子段,其中,M为大于1的整数;

根据下式计算各个语音子段的梅尔频谱倒频系数向量:MelVecm=MFCCFuc(SubVoicem)其中,m为语音子段的序号,1≤m≤M,SubVoicem为第m个语音子段,MFCCFuc为预设的梅尔频谱倒频系数计算函数,MelVecm为第m个语音子段的梅尔频谱倒频系数向量,且MelVecm=(MelCoem,1,MelCoem,2,......,MelCoem,n,......,MelCoem,N),MelCoem,n为第m个语音子段的第n个梅尔频谱倒频系数;

根据下式计算各个语音子段的权重系数:其中,Weightm为第m个语音子段的权重系数;

根据下式构造所述语音信息中的声纹特征向量:VoPrintVec=(VpElem1,VpElem2,......,VpElemn,......,VpElemN)其中, VoPrintVec为所述语音信息中的声纹特征向量。

3.根据权利要求1至2中任一项所述的推送消息播报方法,其特征在于,在接收消息推送服务器下发的推送消息之后,还包括:将所述推送消息与预设的关键词集合中的关键词依次进行匹配,并将与匹配成功的关键词对应的消息类型确定为所述推送消息的消息类型,所述关键词集合中包括与预设的各种消息类型分别对应的各个关键词子集,每个关键词子集中包括一个以上的关键词;

将所述推送消息存储至与所述推送消息的消息类型对应的未读消息队列中。

4.根据权利要求3所述的推送消息播报方法,其特征在于,所述以语音形式播报所述推送消息包括:

选取预设的优先级最高且队列不为空的未读消息队列作为当前消息队列;

以语音形式播报队头消息,并将所述队头消息从所述当前消息队列中删除,所述队头消息为排列在所述当前消息队列的队头位置的推送消息;

判断所述当前消息队列是否为空;

若所述当前消息队列不为空,则返回执行所述以语音形式播报队头消息的步骤,直至所述当前消息队列为空为止;

若所述当前消息队列为空,则返回执行所述选取预设的优先级最高且队列不为空的未读消息队列作为当前消息队列的步骤,直至各个未读消息队列均为空为止。

5.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至4中任一项所述的推送消息播报方法的步骤。

6.一种推送消息播报终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如下步骤:

接收消息推送服务器下发的推送消息;

采集预设的时间段内的语音信息;

判断所述语音信息中是否包含用于指示播报所述推送消息的预设指令;

若所述语音信息中包含用于指示播报所述推送消息的预设指令,则提取所述语音信息中的声纹特征向量;

计算所述语音信息中的声纹特征向量与预设的基准声纹特征向量之间的匹配度,所述基准声纹特征向量为从指定用户的语音中提取的声纹特征向量;

若所述语音信息中的声纹特征向量与所述基准声纹特征向量之间的匹配度大于预设的匹配度阈值,则以语音形式播报所述推送消息;

所述计算所述语音信息中的声纹特征向量与预设的基准声纹特征向量之间的匹配度包括:

根据下式计算所述语音信息中的声纹特征向量与所述基准声纹特征向量之间的匹配度:

其中,n为梅尔频谱倒频系数的序号,1≤n≤N,N为梅尔频谱倒频系数向量的预设维度,StVpElemn为所述基准声纹特征向量的第n个元素,VpElemn为所述语音信息中的声纹特征向量的第n个元素,MatDeg为所述语音信息中的声纹特征向量与所述基准声纹特征向量之间的匹配度。

7.根据权利要求6所述的推送消息播报终端设备,其特征在于,所述提取所述语音信息中的声纹特征向量包括:

将所述语音信息划分为M个语音子段,其中,M为大于1的整数;

根据下式计算各个语音子段的梅尔频谱倒频系数向量:MelVecm=MFCCFuc(SubVoicem)其中,m为语音子段的序号,1≤m≤M,SubVoicem为第m个语音子段,MFCCFuc为预设的梅尔频谱倒频系数计算函数,MelVecm为第m个语音子段的梅尔频谱倒频系数向量,且MelVecm=(MelCoem,1,MelCoem,2,......,MelCoem,n,......,MelCoem,N),MelCoem,n为第m个语音子段的第n个梅尔频谱倒频系数;

根据下式计算各个语音子段的权重系数:其中,Weightm为第m个语音子段的权重系数;

根据下式构造所述语音信息中的声纹特征向量:VoPrintVec=(VpElem1,VpElem2,......,VpElemn,......,VpElemN)其中, VoPrintVec为所述语音信息中的声纹特征向量。

8.根据权利要求6至7中任一项所述的推送消息播报终端设备,其特征在于,在接收消息推送服务器下发的推送消息之后,还包括:将所述推送消息与预设的关键词集合中的关键词依次进行匹配,并将与匹配成功的关键词对应的消息类型确定为所述推送消息的消息类型,所述关键词集合中包括与预设的各种消息类型分别对应的各个关键词子集,每个关键词子集中包括一个以上的关键词;

将所述推送消息存储至与所述推送消息的消息类型对应的未读消息队列中。