1.一种实体关系联合抽取方法,其特征在于,包括:获取句子的词向量矩阵,并对所述句子的词向量矩阵进行关系抽取处理,得到所述句子的关系;
通过对所述句子的关系进行编码处理,得到所述句子的关系向量;
利用所述词向量矩阵和所述关系向量,得到所述句子的实体对,并将所述实体对和所述关系进行组合处理,得到所述句子的三元组信息。
2.根据权利要求1所述的方法,其特征在于,所述获取句子的词向量矩阵包括:获取句子中每个词,并利用编码器对所述每个词进行编码处理,得到所述每个词的词向量;
根据所述句子的长度和所述每个词的词向量,构建所述句子的词向量矩阵。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述句子的词向量矩阵进行关系抽取处理,得到所述句子的关系包括:利用自注意力机制对所述句子的词向量矩阵进行处理,得到包含模拟实体信息的向量矩阵;
通过对所述包含模拟实体信息的向量矩阵进行平均池化处理,得到代表整体的模拟实体信息向量,同时对所述句子的词向量矩阵进行平均池化处理,得到代表整体句子信息向量;
通过将所述代表整体的模拟实体信息向量和所述代表整体句子信息向量进行拼接并输入到多层感知机MLP中,预测出所述句子的关系。
4.根据权利要求3所述的方法,其特征在于,所述利用自注意力机制对所述句子的词向量矩阵进行处理,得到包含模拟实体信息的向量矩阵包括:将所述词向量矩阵分别与查询参数矩阵、关键词参数矩阵以及值参数矩阵相乘,得到查询矩阵、关键字矩阵以及值矩阵;
根据所述查询矩阵和所述关键字矩阵,得到注意力权重矩阵;
根据所述注意力权重矩阵和所述值矩阵,得到包含模拟实体信息的向量矩阵。
5.根据权利要求4所述的方法,其特征在于,所述包含模拟实体信息的向量矩阵为:其中,Q是指查询矩阵;K是指关键字矩阵;V是指值矩阵;dk是指线性变换后的维度。
6.根据权利要求5所述的方法,其特征在于,所述通过对所述包含模拟实体信息的向量矩阵进行平均池化处理,得到代表整体的模拟实体信息向量,同时对所述句子的词向量矩阵进行平均池化处理,得到代表整体句子信息向量包括:avg d×1
h =Avgpool(Yenc(s))∈R
avg
其中,Entity_v是指代表整体的模拟实体信息向量;h 是指代表整体句子信息向量;
Avgpool是指平均池化;Yenc(s)是指词向量矩阵;d是词向量的维度。
7.根据权利要求1所述的方法,其特征在于,所述通过对所述句子的关系进行编码处理,得到所述句子的关系向量包括:利用word2vec的方式对所述句子的关系进行编码处理,得到所述句子的关系向量。
8.根据权利要求1所述的方法,其特征在于,所述利用所述词向量矩阵和所述关系向量,得到所述句子的实体对包括:将所述词向量矩阵和所述关系向量进行拼接处理,得到向量矩阵;
通过将所述向量矩阵进行多层感知机MLP和条件随机场CRF处理,得到所述句子的实体对。
9.一种实体关系联合抽取装置,其特征在于,包括:关系抽取模块,用于获取句子的词向量矩阵,并对所述句子的词向量矩阵进行关系抽取处理,得到所述句子的关系;
获取关系向量模块,用于通过对所述句子的关系进行编码处理,得到所述句子的关系向量;
抽取模块,用于利用所述词向量矩阵和所述关系向量,得到所述句子的实体对,并将所述实体对和所述关系进行组合处理,得到所述句子的三元组信息。
10.根据权利要求9所述的装置,其特征在于,所述关系抽取模块具体用于利用自注意力机制对所述句子的词向量矩阵进行处理,得到包含模拟实体信息的向量矩阵;通过对所述包含模拟实体信息的向量矩阵进行平均池化处理,得到代表整体的模拟实体信息向量,同时对所述句子的词向量矩阵进行平均池化处理,得到代表整体句子信息向量;通过将所述代表整体的模拟实体信息向量和所述代表整体句子信息向量进行拼接并输入到多层感知机MLP中,预测出所述句子的关系。