利索能及
我要发布
收藏
专利号: 2018103096911
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种虚假消息的识别方法,其特征在于,包括:

获取包含目标消息的多个载体文本,以及各个所述载体文本的传播路径;所述传播路径包括传播所述载体文本的传播用户的标识;

基于所述载体文本以及所述传播用户的标识,得到各个所述载体文本的文本矩阵;

将各个所述文本矩阵导入至预设的特征向量计算模型,得到所述目标消息的文本特征向量;

根据所有所述载体文本的传播路径,生成关于所述目标消息的用户传播矩阵;所述用户传播矩阵中包含的各元素具体为每个所述传播用户传播的载体文本的个数;

将所述用户传播矩阵导入到预设的用户特征计算模型,得到所述目标消息对应的用户传播特征向量;

根据所述用户传播特征向量以及所述文本特征向量,计算所述目标消息的真伪指数;

若所述真伪指数在预设的虚假指数范围内,则识别所述目标消息为虚假消息。

2.根据权利要求1所述的识别方法,其特征在于,所述将各个所述文本矩阵导入至预设的特征向量计算模型,得到所述目标消息的文本特征向量,包括:分别获取各个所述载体文本的传播次数、内容特征参数以及传播时间参数;

基于所述传播时间参数对各个所述载体文本进行排序,确定各个所述载体文本的导入次序;

将所述传播次数、所述内容特征参数、所述传播时间参数以及所述文本矩阵,导入到文本时序向量转换模型,得到各个所述载体文本的文本时序向量;所述文本时序向量转换模型具体为:其中, 为导入次序为t的载体文本的所述文本时序向量;η为所述传播次数;ΔT为所述传播时间参数;xu为所述文本矩阵;xt为导入次序为t的载体文本的融合矩阵;xτ为所述内容特征参数;Wa以及ba为所述文本时序向量转换模型的预设调整系数;

基于所述导入次序,将各个所述载体文本的文本时序向量导入到多层反馈循环神经网络的各层级,得到所述目标消息的文本特征向量;所述多层反馈循环神经网络具体为:其中,h0为预设的初始文本向量; 为各个所述载体文本的文本时序向量;

h1、h2…ht-1为所述多层反馈循环神经网络各层级输出的文本特征迭代中间值;ht为所述目标消息的文本特征向量;W、U、b为调整系数。

3.根据权利要求1所述的识别方法,其特征在于,所述将所述用户传播矩阵导入到预设的用户特征计算模型,得到所述目标消息对应的用户传播特征向量,包括:对所述用户传播矩阵进行奇异值分解,得到各个所述传播用户的用户传播系数;

将各个所述用户传播系数分别导入到传播特征向量转换模型,确定各个所述传播用户的用户特征向量;所述用户特征向量转换模型具体为:其中,si为第i个所述传播用户的用户特征向量;yi为第i个所述传播用户的用户传播系数; 为第i个所述传播用户的用户时序向量;Wu、bu、 以及bs为所述用户特征向量转换模型的预设系数;e为自然对数;

基于各个所述传播用户的用户特征向量,生成用户特征矩阵;

根据文本矩阵得到各个所述载体文本的掩码向量,并将所述掩码向量以及所述用户特征矩阵导入到用户传播特征值计算模型,确定各个所述载体文本的用户传播特征值;所述用户传播特征值计算模型具体为:其中,[si]为所述用户特征矩阵;mj为第j篇所述载体文本的掩码向量;pj为第j篇所述载体文本的用户传播特征值;d([si]*mj)为非空元素统计函数;

根据各个所述用户传播特征值,生成所述目标消息的用户传播特征向量。

4.根据权利要求1-3任一项所述的识别方法,其特征在于,所述根据所述用户传播特征向量以及所述文本特征向量,计算所述目标消息的真伪指数,包括:将所述用户传播特征向量以及所述文本特征向量进行聚合,得到所述目标消息的真伪识别矩阵;

将所述真伪识别矩阵导入真伪指数计算模型,得到所述目标消息的真伪指数;所述真伪指数计算模型具体为:其中,为所述真伪指数;[cj]为所述真伪识别矩阵; 以及bc为所述真伪指数计算模型的预设系数;e为自然对数。

5.根据权利要求1所述的识别方法,其特征在于,所述基于所述载体文本以及所述传播用户的标识,得到各个所述载体文本的文本矩阵,包括:基于所述载体文本以及所述传播用户的标识,构建所述目标消息的全局传播矩阵[aij]n×m;其中,所述aij为第i个传播用户对于第j个载体文本的传播标记值;所述n为所述传播用户的个数;所述m为所述载体文本的个数;

将所述全局传播矩阵[aij]n×m中各列构成的子矩阵作为各个所述载体文本的文本矩阵。

6.一种虚假消息的识别设备,其特征在于,所述虚假消息的识别设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:获取包含目标消息的多个载体文本,以及各个所述载体文本的传播路径;所述传播路径包括传播所述载体文本的传播用户的标识;

基于所述载体文本以及所述传播用户的标识,得到各个所述载体文本的文本矩阵;

将各个所述文本矩阵导入至预设的特征向量计算模型,得到所述目标消息的文本特征向量;

根据所有所述载体文本的传播路径,生成关于所述目标消息的用户传播矩阵;所述用户传播矩阵中包含的各元素具体为每个所述传播用户传播的载体文本的个数;

将所述用户传播矩阵导入到预设的用户特征计算模型,得到所述目标消息对应的用户传播特征向量;

根据所述用户传播特征向量以及所述文本特征向量,计算所述目标消息的真伪指数;

若所述真伪指数在预设的虚假指数范围内,则识别所述目标消息为虚假消息。

7.根据权利要求6所述的虚假消息的识别设备,其特征在于,所述将各个所述文本矩阵导入至预设的特征向量计算模型,得到所述目标消息的文本特征向量,包括:分别获取各个所述载体文本的传播次数、内容特征参数以及传播时间参数;

基于所述传播时间参数对各个所述载体文本进行排序,确定各个所述载体文本的导入次序;

将所述传播次数、所述内容特征参数、所述传播时间参数以及所述文本矩阵,导入到文本时序向量转换模型,得到各个所述载体文本的文本时序向量;所述文本时序向量转换模型具体为:其中, 为导入次序为t的载体文本的所述文本时序向量;η为所述传播次数;ΔT为所述传播时间参数;xu为所述文本矩阵;xt为导入次序为t的载体文本的融合矩阵;xτ为所述内容特征参数;Wa以及ba为所述文本时序向量转换模型的预设调整系数;

基于所述导入次序,将各个所述载体文本的文本时序向量导入到多层反馈循环神经网络的各层级,得到所述目标消息的文本特征向量;所述多层反馈循环神经网络具体为:其中,h0为预设的初始文本向量; 为各个所述载体文本的文本时序向量;

h1、h2…ht-1为所述多层反馈循环神经网络各层级输出的文本特征迭代中间值;ht为所述目标消息的文本特征向量;W、U、b为调整系数。

8.根据权利要求6所述的虚假消息的识别设备,其特征在于,所述将所述用户传播矩阵导入到预设的用户特征计算模型,得到所述目标消息对应的用户传播特征向量,包括:对所述用户传播矩阵进行奇异值分解,得到各个所述传播用户的用户传播系数;

将各个所述用户传播系数分别导入到传播特征向量转换模型,确定各个所述传播用户的用户特征向量;所述用户特征向量转换模型具体为:其中,si为第i个所述传播用户的用户特征向量;yi为第i个所述传播用户的用户传播系数; 为第i个所述传播用户的用户时序向量;Wu、bu、 以及bs为所述用户特征向量转换模型的预设系数;e为自然对数;

基于各个所述传播用户的用户特征向量,生成用户特征矩阵;

根据文本矩阵得到各个所述载体文本的掩码向量,并将所述掩码向量以及所述用户特征矩阵导入到用户传播特征值计算模型,确定各个所述载体文本的用户传播特征值;所述用户传播特征值计算模型具体为:其中,[si]为所述用户特征矩阵;mj为第j篇所述载体文本的掩码向量;pj为第j篇所述载体文本的用户传播特征值;d([si]*mj)为非空元素统计函数;

根据各个所述用户传播特征值,生成所述目标消息的用户传播特征向量。

9.根据权利要求6-8任一项所述的虚假消息的识别设备,其特征在于,所述根据所述用户传播特征向量以及所述文本特征向量,计算所述目标消息的真伪指数,包括:将所述用户传播特征向量以及所述文本特征向量进行聚合,得到所述目标消息的真伪识别矩阵;

将所述真伪识别矩阵导入真伪指数计算模型,得到所述目标消息的真伪指数;所述真伪指数计算模型具体为:其中,为所述真伪指数;[cj]为所述真伪识别矩阵; 以及bc为所述真伪指数计算模型的预设系数;e为自然对数。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。