利索能及
我要发布
收藏
专利号: 2021111884612
申请人: 江苏科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于Coarse2Fine网络的相似问题匹配方法,其特征在于,包括以下步骤:步骤1:上传数据集至数据库中,运用数据集训练得到对应的Coarse2Fine模型;

步骤2:通过Coarse2Fine模型接口的上传接口上传待处理语句,运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句,将待处理语句、数条匹配语句作为Coarse2Fine模型的ESIM网络的输入;

步骤3:在ESIM网络中提取待处理语句、匹配语句的特征值,将待处理语句的特征值逐一与数条匹配语句的特征值计算差异性值;

步骤4:在ESIM网络中提取出差异性值小的匹配语句,作为相似语句的输出结果。

2.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤2中,运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句,具体为:将待处理语句与数据库中某一语句进行语素分析,再求两个语句之间相关性的得分,得分计算公式如下:

其中,Q表示输入的语句,d表示数据库中的待匹配语句,qi表示问句匹配的基本单位,Wi表示qi的权重;R(qi,d)表示语素qi与d的相关性得分。

最后根据相关性的得分高低,提取出得分高的且满足需求的数条匹配语句。

3.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,在ESIM网络中提取待处理语句、匹配语句的特征值具体方法如下:ESIM网络使用词嵌入和BiLSTM根据上下文重新学习待处理语句、匹配语句的单词表示,得到待处理语句、匹配语句的编码表示,根据注意力权重得到待处理语句、匹配语句的加权编码表示,将编码表示和加权编码表示作为特征值。

4.如权利要求3所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,ESIM网络使用词嵌入和BiLSTM根据上下文重新学习待处理语句、匹配语句的单词表示,得到待处理语句、匹配语句的编码表示的具体公式如下:其中,a和b分别表示输入的两个语句,i和j表示句子中某个词语的序号,la和lb表示句子a和b的长度, 和 则分别为输入语句a和b中某个单词的向量表示。

5.如权利要求3或4所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,根据注意力权重得到待处理语句、匹配语句的加权编码表示的具体方法为:运用attention机制,计算待处理语句、匹配语句的词向量联系:其中, 表示输入语句a各个词向量的转置和输入语句b中各个词向量之间的乘积;

再根据如下公式计算待处理语句、匹配语句的权重加权后的值,得到待处理语句、匹配语句的加权编码表示的具体公式如下:

其中, 和 分别表示输入语句a和b中某个词的加权编码表示。

6.如权利要求5所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,将 和 分别进行差和点积运算,得到差异性值ma和mb,差异性值计算公式如下:

其中, 和 分别表示输入语句a和b的编码值和加权编码值。

7.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤4具体如下:

通过BiLSTM层获取差异性值的局部推理信息和上下文信息,将获取结果进行最大池化和平均池化,并把池化后的值再次拼接,放到一个新的向量中,将向量输入到多层感知分类器,最后在输出层使用softmax函数得到差异性值小的匹配语句。