利索能及
我要发布
收藏
专利号: 2025107565966
申请人: 山东科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于双域感知结构特征融合学习的谣言检测方法,其特征在于,包括以下步骤:S1.获取社交媒体消息事件数据集,基于数据集构建帖子传播网络图和用户社交网络图,通过图注意力网络编码器分别提取帖子传播特征和用户社交特征;

S2.利用传播密度峰值和斜率划分法识别谣言扩散的关键时间窗口,从帖子传播网络图和用户社交网络图中提取相关的子结构特征;

S3.通过互注意力机制对帖子传播子特征和用户社交子特征进行处理,得到帖子传播融合特征和用户社交融合特征;

S4.通过帖子传播融合特征和用户社交融合特征构建投影矩阵,然后采用投影矩阵对帖子传播融合特征和用户社交融合特征进行加权求和得到帖子传播交互特征和用户社交交互特征,进而生成第一加权帖子传播特征和第一加权用户社交特征;

S5.对第一加权帖子传播特征和第一加权用户社交特征进行同质交互信息建模,得到最终的同质交互综合表示;

S6.将最终的同质交互综合表示与原始推文特征拼接后,输入谣言检测模块进行分类,得到谣言检测结果。

2.根据权利要求1所述的基于双域感知结构特征融合学习的谣言检测方法,其特征在于,步骤S1具体包括:所述社交媒体消息事件数据集 ,其中, 表示第 个事件, 为事件的总数;

为每个事件 构建一个帖子传播网络图 ,传播图的根节点为事件声明; 为帖子传播网络图的节点集合,一个节点表示一个推文; 为帖子传播网络图的边集合,表示推文之间的互动;帖子传播网络图的邻接矩阵为 ,当 时,表示第 个推文与第个推文存在互动关系;当 时,表示第个推文与第个推文无互动关系;

为每个事件 构建一个用户社交网络图 , 为用户社交网络图的节点集合,一个节点表示一个用户; 为用户社交网络图的边集合,表示用户之间的社交关系;用户社交网络图的邻接矩阵为 ,当 时,表示第个用户与第个用户存在关注关系;当 时,表示第个用户与第个用户无关注关系;

将帖子传播网络图和用户社交网络图输入到图注意力网络GAT编码器中进行特征提取,得到帖子传播特征 和用户社交特征 ;所述图注意力网络GAT编码器采用两层图注意力网络GAT编码器,第一层图注意力网络GAT编码器对节点特征进行初步更新,第二层图注意力网络GAT编码器处理第一层图注意力网络GAT编码器的输出特征。

3.根据权利要求2所述的基于双域感知结构特征融合学习的谣言检测方法,其特征在于,步骤S2具体包括:为每个事件 计算传播密度 ,公式表示如下:

其中, 表示指示函数,当时间信息 属于时间 时,取值为1,否则为0;时间按照小时划分; 表示节点 属于节点集合 ;

根据事件 的传播时间和传播密度,得到传播密度图,采用滑动窗口方式检测局部最大值,识别爆发节点,公式如下:,

其中,表示为局部最大值所在时间点, 表示传播过程中的波动峰值, 表示窗口大小, 表示取最大值操作;选取传播密度最高的两个峰值,记为第一峰值时间点,第二峰值时间点 ;

计算传播密度图中每个峰值邻域内的斜率,公式表示如下:,

其中, 表示传播密度图在时间点 的密度值, 表示窗口长度; 表示斜率,代表传播密度在该时刻的变化趋势;

从传播过程中的波动峰值对应的传播密度图中的局部最大点 开始,向两侧查找斜率为± 的点作为爆发区间的边界,从第一峰值时间点 开始,分别向左和向右扫描,寻找第一个 满 足 的 时间 点 ;确 定 传播 爆 发区 间的 边界 :起 始时 间 :;结束时间: ;最终,得到第一

峰值时间点 所对应的传播爆发区间: ;同理,得到第二峰值时间点 所对应的传播爆发区间;

根据获得的传播爆发区间,从帖子传播网络图中筛选出符合爆发区间的节点和边,得到帖子传播子图 ,帖子传播子图满足如下公式:,

其中, 表示帖子传播子图的节点集合, 表示帖子传播子图的边集合;

通过上述过程,从帖子传播网络图中提取出第一峰值时间点 的帖子传播子图 和第二峰值时间点 的帖子传播子图 ;帖子传播子图 和 通过图注意力网络GAT编码器分别进行特征提取,得到对应的第一帖子传播子特征 和第二帖子传播子特征 ;根据帖子传播网络图和用户社交网络图之间的关联,从用户社交网络图中提取与每个帖子传播子图相对应的用户社交子图,采用图注意力网络GAT编码器得到第一用户社交子特征 和第二用户社交子特征 。

4.根据权利要求3所述的基于双域感知结构特征融合学习的谣言检测方法,其特征在于,步骤S3具体包括:将第一帖子传播子特征 、第二帖子传播子特征 、第一用户社交子特征 以及第二用户社交子特征 通过线性变换函数进行特征映射,得到第一帖子传播映射子特征 、第二帖子传播映射子特征 、第一用户社交映射子特征 以及第二用户社交映射子特征 ;

采用多头注意力机制融合特征表示,在多头注意力机制中,每个注意力头通过独立的参数学习不同的注意力分布;对于每个注意力头,计算第一帖子传播映射子特征 和第二帖子传播映射子特征 之间的注意力权重矩阵 ,公式表示如下:,

其中, 表示第 个注意力头的参数,Softmax表示归一化函数, 表示缩放因子;同理,计算得到第一用户社交映射子特征 和第二用户社交映射子特征 之间的注意力权重矩阵 ;

对第一帖子传播映射子特征 和第二帖子传播映射子特征 进行加权求和,得到帖子传播融合子特征,公式表示如下:,

其中, 表示第 个注意力头输出的帖子传播融合子特征;同理,得到用户社交融合子特征 ;在多头注意力机制中,多个注意力头并行计算不同的注意力分布,将多个注意力头的输出拼接在一起,通过线性变换映射到最终的特征空间,公式表示如下,,

其中, 表示帖子传播拼接子特征, 表示拼接操作, 表示第一线性变换矩阵,表示用户社交拼接子特征, 表示第二线性变换矩阵;

将帖子传播拼接子特征 和帖子传播特征 进行融合,得到帖子传播融合特征,公式表示如下:,

其中, 表示帖子传播融合特征;同理,得到用户社交融合特征 。

5.根据权利要求4所述的基于双域感知结构特征融合学习的谣言检测方法,其特征在于,步骤S4具体包括:通过帖子传播融合特征 和用户社交融合特征 构建投影矩阵 ,然后采用投影矩阵对帖子传播融合特征 和用户社交融合特征 进行加权求和得到帖子传播交互特征 和用户社交交互特征 ,公式表示如下:,

其中, 表示双曲正切激活函数, 表示投影矩阵的参数, 表示用户社交特征的线性变换矩阵, 表示帖子传播特征的线性变换矩阵;

分别对帖子传播交互特征 和用户社交交互特征 进行注意力权重分配,通过Softmax函数计算每个特征维度的重要性,并进行加权求和,得到第一加权帖子传播特征和第一加权用户社交特征 :,

其中, 表示Softmax函数。

6.根据权利要求5所述的基于双域感知结构特征融合学习的谣言检测方法,其特征在于,步骤S5具体包括:通过自注意力模块对第一加权帖子传播特征 和第一加权用户社交特征 进行权重重分配,学习内部特征的关联关系与动态重要性,得到第二加权帖子传播特征 和第二加权用户社交特征 ,公式表示如下:,

其中, 表示自注意力机制;

使用门控循环单元GRU对特征 和 进行时序建模,得到最终隐藏状态为 ,公式表示如下:,

其中, 表示门控循环单元操作;将第一加权帖子传播特征 、第一加权用户社交特征 以及最终隐藏状态 进行拼接,得到最终的同质交互综合表示 ,公式表示为:。

7.根据权利要求6所述的基于双域感知结构特征融合学习的谣言检测方法,其特征在于,步骤S6具体包括:将最终的同质交互综合表示 与事件声明 的原始推文特征 进行拼接,得到最终的综合特征 ,公式表示如下:,

通过全连接层和Softmax函数计算预测的概率向量,公式表示如下:,

其中, 表示全连接层操作。

8.根据权利要求7所述的基于双域感知结构特征融合学习的谣言检测方法,其特征在于,在训练过程中,通过最小化预测概率与真实标签分布之间的交叉熵损失来进行优化:,

其中,表示交叉熵损失, 是数据集中的样本数,表示类别数,即分类任务中类别的总数, 表示这是 正则化项,表示模型参数 的平方和, 是正则化因子,表示事件 的真实标签分布。