1.基于深度学习三层语义抽取框架的假新闻识别方法,其特征是,包括:获取目标新闻文本;对目标新闻文本进行向量化处理,得到目标新闻文本每个字的初始表示向量;
将目标新闻文本每个字的上下文信息嵌入到每个字的初始表示向量中,得到含有上下文信息的字向量矩阵;
对含有上下文信息的字向量矩阵,提取若干个特征图;
对所有的特征图,进行封装操作,得到最终融合特征;
对最终融合特征进行分类,得到目标新闻文本是否为假新闻的结果;
对所有的特征图,进行封装操作,得到最终融合特征;具体步骤包括:将所有的特征图输入到胶囊网络中;
通过仿射矩阵对特征图进行封装操作得到胶囊向量;对得到的特征图F进行保留实例化参数的胶囊封装操作,通过m个卷积核通过仿射矩阵Wij对特征图F进行封装,即:uj|i=Wij*F得到胶囊向量uj|i,其中,i表示低层,j表示低层的下一层;
通过对胶囊向量进行卷积操作,得到卷积胶囊的特征图;
迭代卷积三次,得到最终融合特征;根据Hinton的理论,根据聚类的思想,组合低层局部特征到高层,通过更新耦合系数ξij,即: 来决定上层选择的特征,其中,bij是偏置项,初始化值为0;
利用非线性激活函数squashing,将每一层的胶囊向量的长度挤压到[0,1]之间,作为这一层胶囊特征的被输出概率。
2.如权利要求1所述的方法,其特征是,所述获取目标新闻文本步骤之后,所述对目标新闻文本进行向量化处理,得到目标新闻文本每个字的初始表示向量步骤之前,还包括:判断目标新闻文本中是否存在噪音数据;如果存在噪音数据,则对目标新闻文本进行噪音数据去除处理。
3.如权利要求1所述的方法,其特征是,对目标新闻文本进行向量化处理,得到目标新闻文本每个字的初始表示向量;具体步骤包括:将目标新闻文本中的字,处理为token表示向量;
将目标新闻文本中的字,处理为segment表示向量;
将目标新闻文本中的字,处理为position表示向量;
将token表示向量、segment表示向量和position表示向量进行拼接,得到目标新闻文本的初始表示向量。
4.如权利要求1所述的方法,其特征是,将目标新闻文本每个字的上下文信息嵌入到每个字的初始表示向量中,得到含有上下文信息的字向量矩阵;具体步骤包括:将目标新闻文本每个字的初始表示向量,输入到BERT模型的tansformer编码器的自注意力机制单元,输出自注意力矩阵;
利用自注意力矩阵,将目标新闻文本每个字的上下文信息嵌入到每个字的初始表示向量中,得到含有上下文信息的字向量矩阵。
5.如权利要求4所述的方法,其特征是,对含有上下文信息的字向量矩阵,提取若干个特征图;具体步骤包括:对卷积神经网络的每个卷积层设置不同的卷积窗口大小;
利用不同的卷积核对含有上下文信息的字向量矩阵进行卷积操作,得到特征标量;将所有的特征标量组成特征列向量;将所有的特征列向量组成特征图。
6.如权利要求1所述的方法,其特征是,BERT模型、卷积神经网络、胶囊网络和全连接层依次串联,串联后作为新闻真假分类模型;
新闻真假分类模型的训练步骤包括:
构建训练集、测试集;所述训练集和测试集均为已知新闻真假判定结果的新闻文本初始表示向量;
将训练集输入到新闻真假分类模型的BERT模型中,BERT模型提取训练样本的含有上下文信息的字向量矩阵;
卷积神经网络对含有上下文信息的字向量矩阵进行特征提取,提取出特征图;
胶囊网络对特征图进行高层次特征提取,得到最终的特征表示向量;
全连接层,输出最终特征表示向量的分类结果;
当分类结果的准确度超过设定阈值时,停止训练,得到训练好的新闻真假分类模型。
7.基于深度学习三层语义抽取框架的假新闻识别系统,其特征是,包括:获取模块,其被配置为:获取目标新闻文本;对目标新闻文本进行向量化处理,得到目标新闻文本每个字的初始表示向量;
嵌入模块,其被配置为:将目标新闻文本每个字的上下文信息嵌入到每个字的初始表示向量中,得到含有上下文信息的字向量矩阵;
特征图提取模块,其被配置为:对含有上下文信息的字向量矩阵,提取若干个特征图;
封装模块,其被配置为:对所有的特征图,进行封装操作,得到最终融合特征,具体步骤包括:将所有的特征图输入到胶囊网络中;
通过仿射矩阵对特征图进行封装操作得到胶囊向量;对得到的特征图F进行保留实例化参数的胶囊封装操作,通过m个卷积核通过仿射矩阵Wij对特征图F进行封装,即:uj|i=Wij*F得到胶囊向量uj|i,其中,i表示低层,j表示低层的下一层;
通过对胶囊向量进行卷积操作,得到卷积胶囊的特征图;
迭代卷积三次,得到最终融合特征;根据Hinton的理论,根据聚类的思想,组合低层局部特征到高层,通过更新耦合系数ξij,即: 来决定上层选择的特征,其中,bij是偏置项,初始化值为0;
利用非线性激活函数squashing,将每一层的胶囊向量的长度挤压到[0,1]之间,作为这一层胶囊特征的被输出概率;
输出模块,其被配置为:对最终融合特征进行分类,得到目标新闻文本是否为假新闻的结果。
8.一种电子设备,其特征是,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述权利要求1‑6任一项所述的方法。
9.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1‑6任一项所述的方法。