1.一种文本相关性检测方法,其特征在于,包括:分别获取第一文本的第一关键词和第二文本的第二关键词,构成第一关键词向量和第二关键词向量,基于模糊均值算法对所述第一关键词向量和所述第二关键词向量进行聚类分析,得到主题向量,所述主题向量包括所述第一关键词向量中各个关键词所属的主题和所述第二关键词向量中各个关键词所属的主题;
基于所述主题向量确定所述第一文本中各个句子对应的第一主题和所述第二文本中各个句子对应的第二主题,根据所述第一主题和所述第二主题构建主题图,所述第一文本为待检测文本,所述第二文本为标准文本,所述主题图包括由各个关键词所属的主题构成的主题节点和各个主题节点之间的主题边;
基于预设的第一关键词匹配规则,对各个所述主题节点下的句子对构造第一匹配特征;基于预设的第二关键词匹配规则,对各个所述主题节点下的句子对构造第二匹配特征;
针对任意所述主题节点,将该主题节点对应的所述第一匹配特征和所述第二匹配特征进行拼接,得到该主题节点的匹配特征;
基于所述匹配特征得到所述主题图的邻 接矩阵,将所述匹配特征和所述邻 接矩阵输入图卷积模型进行分析,得到所述第一文本中各个句子和所述第二文本中各个句子之间的匹配向量,根据所述匹配向量得到所述第一文本和所述第二文本的相关性。
2.根据权利要求1所述的文本相关性检测方法,其特征在于,所述分别获取所述第一关键词和所述第二关键词,包括:
根据TF‑IDF算法分别对所述第一文本和所述第二文本进行关键词抽取,得到所述第一关键词和所述第二关键词。
3.根据权利要求1所述的文本相关性检测方法,其特征在于,所述基于模糊均值算法对所述第一关键词向量和所述第二关键词向量进行聚类分析,得到主题向量,包括:根据模糊C均值聚类算法分别将预设数量的所述第一关键词和所述第二关键词组成一个主题;
各个所述主题包含的所述第一关键词和所述第二关键词分别构成各个主题各自对应的所述主题向量。
4.根据权利要求3所述的文本相关性检测方法,其特征在于,所述基于所述主题向量确定所述第一文本中各个句子对应的第一主题和所述第二文本中各个句子对应的第二主题,包括:
基于各个所述主题向量与所述第一文本中各个句子之间的相似度,确定所述第一文本中各个句子对应的所述第一主题;
基于各个所述主题向量与所述第二文本中各个句子之间的相似度,确定所述第二文本中各个句子对应的所述第二主题。
5.一种文本相关性检测装置,其特征在于,包括:第一得到模块,用于分别获取第一文本的第一关键词和第二文本的第二关键词,构成第一关键词向量和第二关键词向量,基于模糊均值算法对所述第一关键词向量和所述第二关键词向量进行聚类分析,得到主题向量,所述主题向量包括所述第一关键词向量中各个关键词所属的主题和所述第二关键词向量中各个关键词所属的主题;
构造模块,用于基于所述主题向量确定所述第一文本中各个句子对应的第一主题和所述第二文本中各个句子对应的第二主题,根据所述第一主题和所述第二主题构建主题图,所述第一文本为待检测文本,所述第二文本为标准文本,所述主题图包括由各个关键词所属的主题构成的主题节点和各个主题节点之间的主题边;
第二得到模块,用于基于预设的第一关键词匹配规则,对各个所述主题节点下的句子对构造第一匹配特征;基于预设的第二关键词匹配规则,对各个所述主题节点下的句子对构造第二匹配特征;针对任意所述主题节点,将该主题节点对应的所述第一匹配特征和所述第二匹配特征进行拼接,得到该主题节点的匹配特征;
第三得到模块,用于基于所述匹配特征得到所述主题图的邻 接矩阵,将所述匹配特征和所述邻 接矩阵输入图卷积模型进行分析,得到所述第一文本中各个句子和所述第二文本中各个句子之间的匹配向量,根据所述匹配向量得到所述第一文本和所述第二文本的相关性。
6.一种文本相关性检测设备,其特征在于,所述文本相关性检测设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至4中任一项所述的文本相关性检测方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至4中任一项所述的文本相关性检测方法。