利索能及
我要发布
收藏
专利号: 202410227224X
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于知识图谱检索的虚假新闻检测方法,其特征在于,包括:获取事实验证数据并对事实验证数据进行语义角色标注获得对应的语义信息作为声明答案;

根据语义信息通过以大型双向自回归变压器为基础的问题生成模型生成第一问题,包括:将事实验证数据中的原始声明以及声明答案输入至问题生成模型的第一多头自注意机制和第一前馈神经网络层获得中间特征N;将中间特征N和带掩码的原始声明输入至问题生成模型的第二多头自注意机制和第二前馈神经网络层生成第一问题;

根据第一问题由证据数据库中检索获得第一证据信息,将第一证据信息作为上下文信息得到第一证据答案;

将事实验证数据中的原始声明分为若干子声明,然后将第一证据答案与声明答案通过注意力机制进行相似度分析以获得标签预测概率;根据标签预测概率对子声明进行分类获得可信预测答案和不可信预测答案,对可信预测答案进行保留;

对可信预测答案进行知识增强提取子图,包括:

将声明答案到第一证据答案分别作为节点,构建相同问题对应的声明答案到第一证据答案的连接边,对可信预测答案进行知识图谱检索来进行子图提取;

通过注意力机制学习节点v与相邻节点 之间的权重 ,表示公式为:;

基于权重 计算获得节点v学习到的内部结构,表达公式为:;

公式中, 、 、 和 表示为学习参数; 表示为节点 的节点特征; 表示为节点v的节点特征; 表示为节点v与相邻节点j之间的相关性得分;为激活函数;

表示为节点v学习到的内部结构; 为节点v的邻居节点个数;

根据子图来训练问题生成模型;通过训练后的问题生成模型为所述不可信预测答案所对应的问题生成第二问题;对第二问题进行预测获得第二证据答案;根据可信预测答案和第二证据答案进行虚假新闻检测。

2.根据权利要求1所述的虚假新闻检测方法,其特征在于,对事实验证数据进行语义角色标注获得对应的语义信息的过程包括:识别事实验证数据中的动词,标记动词与相关单词或短语的关系映射并分配角色获得对应的语义信息。

3.根据权利要求1所述的虚假新闻检测方法,其特征在于,将第一证据答案与声明答案通过注意力机制进行相似度分析以获得标签预测概率,包括:将相同第一问题对应的第一证据答案与声明答案拼接而成的答案对,然后把答案对转化为答案特征,将第一证据答案与声明答案输入至Transformer模型的注意力机制获得注意力权重,表达公式为:;

公式中, 表示为注意力权重, 表示为第一证据答案, 表示为声明答案; 、和 表示为可学习的参数; 表示为激活函数;

根据注意力权重对答案特征进行加权求和获得预测特征F,表示公式为:;

公式中, 表示为由答案对转化的答案特征;

将预测特征F输入至全连接层获得标签预测概率。

4.根据权利要求1所述的虚假新闻检测方法,其特征在于,根据标签预测概率对子声明进行分类获得可信预测答案和不可信预测答案,包括:所述标签预测概率分为支持标签概率与否定标签概率;若支持标签概率与否定标签概率差值小于0.005,则将子声明的标签预测标记为不可信预测答案;否则,将子声明的标签预测标记为可信预测答案。

5.根据权利要求1所述的虚假新闻检测方法,其特征在于,通过训练后的问题生成模型为所述不可信预测答案所对应的问题生成第二问题,包括:通过门控过滤模块对声明答案到第一证据答案对应节点上的信息进行筛选获得门控特征 ,表达公式为:;

其中, 、 和 代表可训练参数, , 分别代表来自同一问题的证据答案节点和声明答案节点, 为所对应的门控过滤向量, 表示Hadamard积;

将门控特征 和所述不可信预测答案所对应的原始声明以及声明答案输入至问题生成模型的第一多头自注意机制和第一前馈神经网络层获得中间特征 ;

将中间特征 和所述不可信预测答案所对应的带掩码原始声明输入至问题生成模型的第二多头自注意机制和第二前馈神经网络层生成第二问题。

6.一种基于知识图谱检索的虚假新闻检测系统,其特征在于,包括:获取模块,用于获取事实验证数据并对事实验证数据进行语义角色标注获得对应的语义信息作为声明答案;

筛选模块,获取事实验证数据并对事实验证数据进行语义角色标注获得对应的语义信息作为声明答案;根据语义信息通过以大型双向自回归变压器为基础的问题生成模型生成第一问题;根据第一问题由证据数据库中检索获得第一证据信息,将第一证据信息作为上下文信息得到第一证据答案;将第一证据答案与声明答案通过注意力机制进行相似度分析以获得标签预测概率,将事实验证数据中的原始声明分为若干子声明;根据标签预测概率对子声明进行分类获得可信预测答案和不可信预测答案,对可信预测答案进行保留;

判定模块,用于对可信预测答案进行知识增强提取子图,根据子图来训练问题生成模型;通过训练后的问题生成模型为所述不可信预测答案所对应的问题生成第二问题;对第二问题进行预测获得第二证据答案;根据可信预测答案和第二证据答案进行虚假新闻判断;

所述筛选模块根据语义信息通过以大型双向自回归变压器为基础的问题生成模型生成第一问题,包括:将事实验证数据中的原始声明以及声明答案输入至问题生成模型的第一多头自注意机制和第一前馈神经网络层获得中间特征N;将中间特征N和带掩码的原始声明输入至问题生成模型的第二多头自注意机制和第二前馈神经网络层生成第一问题;

所述判定模块对可信预测答案进行知识增强提取子图,包括:将声明答案到第一证据答案分别作为节点,构建相同问题对应的声明答案到第一证据答案的连接边,对可信预测答案进行知识图谱检索来进行子图提取;

通过注意力机制学习节点v与相邻节点 之间的权重 ,表示公式为:;

基于权重 计算获得节点v学习到的内部结构,表达公式为:;

公式中, 、 、 和 表示为学习参数; 表示为节点 的节点特征; 表示为节点v的节点特征; 表示为节点v与相邻节点j之间的相关性得分;为激活函数;

表示为节点v学习到的内部结构; 为节点v的邻居节点个数。

7.电子设备包括存储介质和处理器;所述存储介质用于存储指令;其特征在于,所述处理器用于根据所述指令进行操作以执行权利要求1至权利要求5任一项所述的虚假新闻检测方法。