1.一种自适应门控残差连接的相关性虚假新闻检测方法,其特征在于,步骤如下:S1:利用Electra编码器将新闻文档转换为词嵌入向量;
S2:将词嵌入向量输入到多尺度循环卷积神经网络中,提取全局或局部语义的词嵌入特征;词嵌入向量通过自适应门控残差连接来控制残差流量,得到的残差信息与词嵌入特征采用像素加法叠加,得到关键词嵌入特征;所述多尺度循环卷积神经网络由多个 RCNN并联而成;所述自适应门控残差连接是在残差连接的基础上添加一个门控开关来控制残差信息的接收;
S3:在批样本中,利用文档级交叉注意力,根据新闻文档之间的相关性来给予新闻文档不同的影响权重,得到文档级交叉注意力的输出;词嵌入特征平均后得到的文档特征通过自适应门控残差连接来控制残差流量,然后与文档级交叉注意力的输出采用像素加法叠加,获得最终文档特征;
S4:将最终文档特征送入分类器,分类器输出新闻检测结果。
2.根据权利要求1所述的一种自适应门控残差连接的相关性虚假新闻检测方法,其特征在于,根据分类器输出计算焦点损失函数。
3.根据权利要求1所述的一种自适应门控残差连接的相关性虚假新闻检测方法,其特征在于,所述多尺度循环卷积神经网络的操作用以下公式表示: (1);
式中,X为输入的句子, 为Electra的词嵌入矩阵, 为通过Electra获得的词嵌入向量, 表示尺度 下的循环卷积操作, 表示将不同尺度的词嵌入特征进行合并,得到全局或局部语义的词嵌入特征E。
4.根据权利要求3所述的一种自适应门控残差连接的相关性虚假新闻检测方法,其特征在于,步骤S2中,得到关键词嵌入特征的过程用以下公式表示: (2);
(3);
(4);
式中, 为通过Electra获得的词嵌入向量 与多尺度循环卷积神经网络输出的词嵌入特征E的差值, 的大小表示多尺度循环卷积神经网络提取信息的充分程度; 表示通过Electra获得的词嵌入向量的自适应门控残差连接门控开关的权重, 是通过Electra获得的词嵌入向量的自适应门控残差连接的参数矩阵, sigmoid为激活函数;
为自适应门控残差连接输出的关键词嵌入特征。
5.根据权利要求4所述的一种自适应门控残差连接的相关性虚假新闻检测方法,其特征在于,步骤S3中,利用文档级交叉注意力,根据新闻文档之间的相关性来给予新闻文档不同的影响权重,得到文档级交叉注意力的输出,过程如下:若新闻文档有N个关键词嵌入特征: ,通过对所有关键词嵌入特征进行平均池化得到的文档级特征为: ,为新闻文档的第i个关键词嵌入特征;各新闻文档的文档级特征组成文档级特征向量,将文档级特征向量乘以可学习的随机初始化的参数矩阵后,生成查询向量Q、键向量K和值向量V,通过计算一个新闻文档的查询向量Q和另一个新闻文档键向量K的点积,得到两两新闻文档的相关度注意力分数矩阵,除以一个缩放因子后,再通过Softmax函数进行归一化,得到各新闻文档与其他新闻文档的相关度注意力权重;最后,将各新闻文档的值向量V根据与其他新闻文档的相关度注意力权重进行加权求和,得到文档级交叉注意力的输出。
6.根据权利要求5所述的一种自适应门控残差连接的相关性虚假新闻检测方法,其特征在于,文档级交叉注意力的输出计算公式如下: (5);
式中, 为第m个新闻文档的查询向量, 为第j个新闻文档的键向量, 为 的转置, 为第j个新闻文档的值向量,m≠j, 为缩放因子, 表示文档级交叉注意力的输出。
7.根据权利要求6所述的一种自适应门控残差连接的相关性虚假新闻检测方法,其特征在于,步骤S3中获得最终文档特征的过程表示如下: (6);
(7);
(8);
式中, 为进行平均池化得到的文档特征D与文档级交叉注意力输出特征F的差值,门控开关的权重 表示 与文档级交叉注意力输出特征F之间的相似度分数,是参数矩阵,sigmoid为激活函数, 为最终文档特征。