利索能及
我要发布
收藏
专利号: 2019106506804
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种视频节目处理方法,其特征在于,包括:

获取用户播放的目标视频节目中的目标音频信息和目标人脸图像信息,所述目标音频信息和目标人脸图像信息为所述目标视频节目中同一播放时段内所获取的信息;

根据预设声纹匹配模型对所述目标音频信息进行声纹特征提取,以提取目标声纹特征信息;

确定所述目标声纹特征信息对应的声纹置信度,所述声纹置信度用于指示所述目标声纹特征信息与在所述同一播放时段内所述目标视频节目出现的人物的对应关系的可信程度;

根据目标声纹特征信息对应的声纹置信度,以及目标人脸图像信息确定所采用的目标人物信息;

根据所述目标人物信息确定目标视频节目,所述目标视频节目为与所述目标人物信息相关联的节目;

向所述用户推荐所述目标视频节目。

2.如权利要求1所述的视频节目处理方法,其特征在于,所述获取用户播放的目标视频节目中的目标音频信息和目标人脸图像信息,包括:接收用户端发送的视频感兴趣片段,所述视频感兴趣片段为所述用户端播放所述目标视频节目过程中,采集所述用户观看所述目标视频节目过程中的微表情信息,并对所述微表情信息进行微表情识别后得到,所述视频感兴趣片段为所述目标视频节目中的其中一段;

获取所述视频感兴趣片段中的所述目标音频信息和目标人脸图像信息。

3.如权利要求1所述的视频节目处理方法,其特征在于,所述根据目标声纹特征信息对应的声纹置信度,以及目标人脸图像信息确定所采用的目标人物信息,包括:当所述声纹置信度大于或等于第一预设置信度阈值时,将所述目标声纹特征信息确定为所采用的所述目标人物信息;

当所述声纹置信度大于或等于第二预设置信度阈值、且小于所述第一预设置信度阈值时,将所述目标人脸图像信息和所述目标声纹特征信息中的任意一个信息确定为所采用的所述目标人物信息;

当所述声纹置信度小于所述第二预设置信度阈值时,将所述目标人脸图像信息确定为所采用的所述目标人物信息。

4.如权利要求1-3任一项所述的视频节目处理方法,其特征在于,所述根据所述目标人物信息确定目标视频节目,包括:采集多个视频节目;

分析所述多个视频节目,以获得所述多个视频节目中每个视频节目关联的人物的声纹特征和人脸特征;

建立声学人脸特征表,将所述声学人脸特征表对应存储在视频数据库中,所述声学人脸特征列表包括每个人物信息各自关联的视频节目,以及所述人物信息在每个视频节目中对应的人物的声纹特征以及人脸特征;

根据所述目标人物信息以及所述声学人脸特征表,从所述视频数据库确定出所述目标视频节目。

5.如权利要求4所述的视频节目处理方法,其特征在于,所述根据所述目标人物信息以及所述声学人脸特征表,从所述视频数据库确定出所述目标视频节目,包括:若将所述目标声纹特征信息确定为所采用的所述目标人物信息,将所述目标声纹特征信息与所述声学人脸特征表进行匹配,以匹配出目标声纹特征;将所述目标声纹特征对应的目标视频节目作为所述目标视频节目;

若将所述目标人脸图像信息确定为所采用的所述目标人物信息,则从所述目标人脸图像信息提取出人脸特征;将所述人脸特征与所述声学人脸特征表进行匹配,以匹配出目标人脸特征;将所述目标人脸特征对应的目标视频节目作为所述目标视频节目。

6.一种视频节目处理装置,其特征在于,包括:

获取模块,用于获取用户播放的目标视频节目中的目标音频信息和目标人脸图像信息,所述目标音频信息和目标人脸图像信息为所述目标视频节目中同一播放时段内所获取的信息;

提取模块,用于根据预设声纹匹配模型对所述目标音频信息进行声纹特征提取,以提取目标声纹特征信息;

第一确定模块,用于确定所述目标声纹特征信息对应的声纹置信度,所述声纹置信度用于指示所述目标声纹特征信息与在所述同一播放时段内所述目标视频节目出现的人物的对应关系的可信程度;

第二确定模块,用于根据目标声纹特征信息对应的声纹置信度,以及目标人脸图像信息确定所采用的目标人物信息;

第三确定模块,用于根据所述目标人物信息确定目标视频节目,所述目标视频节目为与所述目标人物信息相关联的节目;

推荐模块,用于向所述用户推荐所述目标视频节目。

7.如权利要求6所述的视频节目处理装置,其特征在于,所述获取模块具体用于:接收用户端发送的视频感兴趣片段,所述视频感兴趣片段为所述用户端播放所述目标视频节目过程中,采集所述用户观看所述目标视频节目过程中的微表情信息,并对所述微表情信息进行微表情识别后得到,所述视频感兴趣片段为所述目标视频节目中的其中一段;

获取所述视频感兴趣片段中的所述目标音频信息和目标人脸图像信息。

8.如权利要求6所述的视频节目处理装置,其特征在于,所述第二确定模块具体用于:当所述声纹置信度大于或等于第一预设置信度阈值时,将所述目标声纹特征信息确定为所采用的所述目标人物信息;

当所述声纹置信度大于或等于第二预设置信度阈值、且小于所述第一预设置信度阈值时,将所述目标人脸图像信息和所述目标声纹特征信息中的任意一个信息确定为所采用的所述目标人物信息;

当所述声纹置信度小于所述第二预设置信度阈值时,将所述目标人脸图像信息确定为所采用的所述目标人物信息。

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至

5任一项所述的视频节目处理方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的视频节目处理方法。