1.一种观点验证方法,其特征在于,包括:
获取待验证观点,基于所述待验证观点发起搜索,确定与待验证观点对应的第一文档;
确定所述第一文档中与所述待验证观点关联的第一文本内容;
确定所述第一文本内容中的目标文本内容所在的第一目标文档,并确定所述第一目标文档的关联文档;
基于所述待验证观点和所述目标文本内容,确定所述关联文档中与所述待验证观点关联的第二文本内容;
基于所述第一文本内容和所述第二文本内容对所述待验证观点的真实性进行验证。
2.根据权利要求1所述的方法,其特征在于,所述基于所述待验证观点发起搜索,确定与待验证观点对应的第一文档,包括:确定所述待验证观点中所包含的关键词;
基于所述关键词发起搜索,确定包含所述关键词的第一文档。
3.根据权利要求1或2所述的方法,其特征在于,所述确定所述第一文档中与所述待验证观点关联的第一文本内容,包括:针对任一第一文档,基于预先训练的编码器对所述待验证观点、该第一文档中的文本内容以及该第一文档的文档标题进行编码,确定该第一文档对应的第一编码序列;
将所述第一编码序列输入至预先训练的特征融合网络,确定该第一文档中的各文本内容与所述待验证观点之间的第一相关度;
基于各第一文档中各文本内容与所述待验证观点之间的第一相关度,确定所述第一文本内容。
4.根据权利要求3所述的方法,其特征在于,所述确定所述第一文本内容中的目标文本内容所在的第一目标文档,包括:将对应的第一相关度满足预设条件的第一文本内容作为所述目标文本内容,并确定所述目标文本内容所在的第一目标文档;
所述确定所述第一目标文档的关联文档,包括:
确定所述第一目标文档中的超链接对应的关联文档;或者,确定与所述第一目标文档的关联度超过预设值的关联文档。
5.根据权利要求1~4任一所述的方法,其特征在于,所述基于所述待验证观点和所述目标文本内容,确定所述关联文档中与所述待验证观点关联的第二文本内容,包括:针对任一关联文档,基于预先训练的编码器对所述待验证观点、所述目标文本内容、该关联文档中的文本内容以及该关联文档的文档标题进行编码,确定该关联文档对应的第二编码序列;
将所述第二编码序列输入至预先训练的特征融合网络,确定该关联文档中的各文本内容与所述待验证观点之间的第二相关度;
基于各关联文档中各文本内容与所述待验证观点之间的第二相关度,确定所述第二文本内容。
6.根据权利要求3或5所述的方法,其特征在于,所述方法还包括根据以下方法训练所述编码器:获取多组样本数据,其中每组样本数据包含样本前提和样本论据,每组样本数据对应有对应的标签,所述标签用于表示所述样本前提和所述样本论据之间的关系;
基于所述样本数据对待训练的编码器进行预训练,得到预训练的编码器;
对所述预训练的编码器进行微调处理,得到训练好的编码器。
7.根据权利要求6所述的方法,其特征在于,所述基于所述样本数据对待训练的编码器进行预训练,得到预训练的编码器,包括:将所述样本数据输入至所述待训练的编码器,得到所述样本数据对应的第三编码序列;
基于第一分类器对所述第三编码序列进行分类处理,得到所述样本数据对应的预测关系;
基于所述样本数据对应的预测关系和所述样本数据对应的标签,对所述待训练的编码器进行预训练,得到所述预训练的编码器。
8.根据权利要求6或7所述的方法,其特征在于,所述对所述预训练的编码器进行微调处理,得到训练好的编码器,包括:获取样本观点,以及样本观点对应的标签,所述样本观点对应的标签用于表征所述样本观点的真实性;
基于所述预训练的编码器,确定与所述样本观点关联的样本文本内容;
将所述样本观点和所述样本观点关联的样本文本内容输入至所述预训练的编码器中,确定第一样本编码序列;
基于多层级注意力机制对所述第一样本编码序列和所述样本观点进行处理后,基于第二分类器确定所述样本观点对应的分类结果;
基于所述样本观点对应的分类结果和所述样本观点对应的标签,对所述预训练的编码器进行微调处理,得到训练好的编码器。
9.根据权利要求1~8任一所述的方法,其特征在于,所述基于所述第一文本内容和所述第二文本内容对所述待验证观点的真实性进行验证,包括:将所述第一文本内容、所述第二文本内容和所述待验证观点输入至预先训练的编码器中,得到第四编码序列;
基于多层级注意力机制对所述第四编码序列和所述待验证观点进行处理,得到第五编码序列;
基于预先训练的第二分类器对所述第五编码序列进行分类,确定所述待验证观点的真实性。
10.一种数据发布方法,其特征在于,包括:
获取待发布数据;
将所述待发布数据作为待验证观点,并基于权利要求1~9任一所述的观点验证方法检测所述待发布数据的真实性;
在所述待发布数据为真实数据的情况下,将所述待发布数据进行发布。
11.一种观点验证装置,其特征在于,包括:
第一获取模块,用于获取待验证观点,基于所述待验证观点发起搜索,确定与待验证观点对应的第一文档;
第一确定模块,用于确定所述第一文档中与所述待验证观点关联的第一文本内容;
第二确定模块,用于确定所述第一文本内容中的目标文本内容所在的第一目标文档,并确定所述第一目标文档的关联文档;
第三确定模块,用于基于所述待验证观点和所述目标文本内容,确定所述关联文档中与所述待验证观点关联的第二文本内容;
验证模块,用于基于所述第一文本内容和所述第二文本内容对所述待验证观点的真实性进行验证。
12.一种数据发布装置,其特征在于,包括:
第二获取模块,用于获取待发布数据;
检测模块,用于将所述待发布数据作为待验证观点,并基于权利要求1~9任一所述的观点验证方法检测所述待发布数据的真实性;
发布模块,用于在所述待发布数据为真实数据的情况下,将所述待发布数据进行发布。
13.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至9任一项所述的观点验证方法的步骤,或执行如权利要求10所述的数据发布方法的步骤。
14.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任一项所述的观点验证方法的步骤,或执行如权利要求10所述的数据发布方法的步骤。