利索能及
我要发布
收藏
专利号: 2018111774004
申请人: 桂林电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种面向问答领域动态计算问句与答案相似性的方法,其特征在于,所述问句包括答案问句部和问句答案部分,所述计算问句与答案相似性的方法包括:计算答案问句部分答案各方面向量与加权问句向量的相似性得分,其中所述答案各方面向量包括答案实体向量、答案类型向量和答案内容向量;

计算问句向量与答案向量的最终相似性得分,详细流程为:步骤1、计算答案问句部分答案各方面向量与加权问句向量的相似性得分,其中,将答案分为了三个部分分别为:答案实体,答案类型和答案内容;

步骤1.1、对于问句的处理首先采用Jieba分词对中文问句进行分词处理,将分词后经word2vec训练后的向量,作为Bi‑LSTM处理的输入,从而获得获取问句的向量表示:其中,hj表示经Bi‑LSTM处理后的问句向量表示,它包含两个方向的向量 和步骤1.2,计算问句向量的权重αij,即答案各个方面对问句不同词向量的关注程度,计算公式为:

T

其中,wij=f(W[hj;ei]+b),αij实质为一个softmax函数,其中参数wij的计算函数f为非T T

线性激活函数,在此非线性激活函数中W 为答案问句部分的中间矩阵,b为差值,且W 和b在训练过程中随机更新;另外,ei∈(ee,et,ec)表示答案的各个方面包括,ee答案实体,et答案类型和ec答案内容;

步骤1.3、给问句向量赋予权重,加权后问句向量的表示为qi,计算公式为:步骤1.4、计算问句向量与答案各方面相似性得分,计算公式为:S(q,ei)=f(qi,ei)其中,得分函数f(·)为问句向量与答案向量的内积;

步骤2、结合问句答案部分不同问句对答案各方面的关注程度,计算问句向量与答案向量的最终相似性得分;

步骤2.1计算不同问句的平均向量表示将在第一个部分中经Bi‑LSTM输出的向量,接入一个平均池化层,从而获得最终的向量表示,计算公式为:

式中,n表示分词后,问句中所包含的词向量的个数;

步骤2.2计算答案向量的权值 即不同向量对答案各个方面的关注程度,计算公式为:

其中, 且 为步骤2.1中计算得到的不同问句的平均向量表示,同T

理,式中 为softmax函数,计算 的函数为非线性激活函数,W 和b分别为中间矩阵和差值,它们的值在训练过程中随机更新;

步骤2.3计算问句向量与答案向量的最终相似性得分,计算公式为:式中,将答案向量的权值 赋给步骤1中计算出来的问句向量与答案各方面向量的相似性得分S(q,ei),问句向量与答案向量的动态结合,使问句与答案紧密相关。