1.一种基于小样本学习的文本实体关系分类方法,其特征在于,包括以下步骤:
步骤1:采用CNN网络作为实例编码器对给定数据集中支持集语句以及查询集语句进行编码,将支持集语句以及查询集语句转化为低维实例向量,获得抽取语料的实体对特征;
步骤2:在小样本学习的场景下,利用原型级注意力机制模块,为每个实例赋予权重,从而得到加权后的原型向量;
步骤3:将经由步骤1编码得到的支持集实例拼接成一个向量矩阵,通过距离级注意力机制模块,提取支持集实例中重要维度的语义特征,从而获得距离级注意力机制的权重β;
步骤4:步骤3中得到的距离级注意力机制权重β与曼哈顿距离公式相乘,得到新的距离公式作为度量函数;利用所述度量函数对查询集中的查询实例与步骤2中求得的原型向量进行距离度量;
步骤5:根据步骤4中求得的距离公式,比较查询实例与原型向量之间的距离;利用softmax函数进行关系分类;
所述步骤2利用原型级注意力机制模块,为每个实例赋予权重,从而得到加权后的原型向量,包含以下步骤:
2‑1利用高斯函数作为激活函数,求取为每个样本实例赋予的权重γij,并最终利用权重对每个关系实例进行加权求和,求得整个关系的原型级关系向量表示ci,分别表示为:其中,qj表示查询集实例,M表示数据集中存在的关系种类,K表示每个关系种类下的实例数量,xij表示在关系i下的第j个支持集实例,σi表示为高斯函数的参数值;
所述步骤3通过距离级注意力机制模块,提取支持集实例中重要维度的语义特征,从而获得距离级注意力机制的权重β,包含以下步骤:
3‑1将支持集中实例句子按照关系进行划分,将每个关系ri中的K个支持集实例[xi1,xi2,...,xiK]经由步骤1中的实例编码器进行处理,并拼接成一个K*dh*1的向量矩阵,其中K表示每个关系种类下的实例数量,dh表示隐藏层单元;
3‑2将向量矩阵通过一个由三层卷积层以及三层ReLU函数层交织的模块,提取支持集实例中对维度值不为0的语义特征,维度变为1*dh*1,从而获得距离级注意力机制权重β。
2.根据权利要求1所述的基于小样本学习的文本实体关系分类方法,其特征在于,所述步骤1中,采用CNN网络作为实例编码器对给定数据集中支持集语句以及查询集语句进行编码,包含以下步骤:
1‑1利用Glove词嵌入和实体位置嵌入的方式将输入数据集中的语料转化为低维词向量形式;将经由Glove词嵌入后得到的句子表示为一个向量列表(x0,x1,x2,...,xi),其中xi表示第i个词嵌入,实体位置嵌入是计算向量列表中每个词嵌入向量xm(m∈[0,i])到句子中两个头尾实体之间的距离,将Glove词嵌入与实体位置嵌入组合,表示为{e1,...,en}={[WF1;PF1]...,[WFn;PFn]},从而形成句子的嵌入向量序列;
1‑2利用CNN网络对步骤1‑1中得到的最终的句子的嵌入向量序列做进一步处理,提取其中的语义特征,分为卷积层和最大池化层;其中卷积层是利用长度为m的卷积滑动窗口对句子嵌入向量序列提取特征,并将得到的提取特征后的向量序列通过ReLU激活函数进行处理得到句子隐藏嵌入;最大池化层对卷积层得到的句子隐藏嵌入进行处理;最终得到整个句子的实例向量。
3.根据权利要求1所述的基于小样本学习的文本实体关系分类方法,其特征在于,所述步骤4建立的度量公式包含以下步骤:
4‑1选用曼哈顿距离公式作为距离公式;
4‑2将距离级注意力机制权重β与4‑1中选用的距离公式相乘得到距离函数d(x,y),作为新的度量函数,表现为:其中n表示维度,xi与yi分别表示x、y在i维度下的数值。
4.根据权利要求1所述的基于小样本学习的文本实体关系分类方法,其特征在于,所述步骤5建立的使用softmax函数进行关系分类包含以下步骤:
5‑1根据原型级关系向量表示ci以及距离函数d(x,y),计算查询集中某一实例与ci之间的距离 表示查询集实例x经过实例编码层后得到的向量;
5‑2对于查询集合中的实例,判断具体属于关系集R中的哪一个关系;具体表示为:其中条件概率 为查询集实例x在关系ri下的概率。
5.一种计算机设备,其特征在于:该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述计算机程序时实现如权利要求1‑4中任一项所述的基于小样本学习的文本实体关系分类方法。
6.一种计算机可读存储介质,其特征在于:该计算机可读存储介质存储有执行如权利要求1‑4中任一项所述的基于小样本学习的文本实体关系分类方法的计算机程序。