利索能及
我要发布
收藏
专利号: 2020110322755
申请人: 华南师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种词嵌入表示方法,其特征在于,包括步骤:

获取待表示词语、所述待表示词语所激活的大脑区域位置、所述待表示词语之间的从属关系以及所述待表示词语对应的第一词嵌入表示;

根据所述待表示词语所激活的大脑区域位置和所述待表示词语之间的从属关系,构建词语关系树;其中,所述词语关系树包括所述待表示词语对应的词语节点、所述词语节点对应的第一词嵌入表示和所述词语节点之间的初始连接关系;

根据所述词语节点之间的初始连接关系,获取每个所述词语节点的邻居节点;其中,所述邻居节点包括与所述词语节点直接连接的节点以及与所述词语节点间接连接的节点;

将所述词语节点与所述邻居节点连接,得到所述词语关系树对应的词语关系图;

基于所述词语关系图和预设的图注意力网络,获取所述词语关系图中每个所述待表示词语的第二词嵌入表示。

2.根据权利要求1所述的词嵌入表示方法,其特征在于,所述基于所述词语关系图和预设的图注意力网络,获取所述词语关系图中每个所述待表示词语的第二词嵌入表示,包括步骤:基于共享注意力机制,获取每个所述邻居节点对所述词语节点的注意力系数;其中,所述注意力系数标识每个所述邻居节点对所述词语节点的重要性程度;

根据所述注意力系数和预设的归一化函数,得到所述注意力系数的注意力权重;

获取不同代的所述邻居节点对所述词语节点的距离权重;其中,同代的所述邻居节点处于所述词语关系树的同一层;

根据所述注意力权重、所述距离权重和预设的词嵌入表示传播策略,获取每个所述待表示词语的第二词嵌入表示。

3.根据权利要求2所述的词嵌入表示方法,其特征在于,所述基于共享注意力机制,获取每个所述邻居节点对所述词语节点的注意力系数,包括步骤:根据所述词语节点的第一词嵌入表示和预设的共享注意力机制函数,得到每个所述邻居节点对所述词语节点的注意力系数;其中,所述预设的共享注意力机制函数如下:为词语节点的第一词嵌入表示,N为所述词语关系图中词语节点的

个数,S为第一词嵌入表示的维度,W为共享可学习参数矩阵, , 函数是单层前馈神经网络,其激活函数是 ,a为权重向量, ,T代表向量的转置操作, 为预设系数。

4.根据权利要求2所述的词嵌入表示方法,其特征在于,所述邻居节点包括祖先节点和后裔节点,所述根据所述注意力系数和预设的归一化函数,得到所述注意力系数的注意力权重,包括步骤:获取所述祖先节点的注意力系数和所述后裔节点的注意力系数;

根据所述祖先节点的注意力系数和所述后裔节点的注意力系数以及预设的第一归一化函数,分别计算所述祖先节点的注意力系数的注意力权重和所述后裔节点的注意力系数的注意力权重;其中,所述预设的第一归一化函数如下:当 时, 为祖先节点的注意力系数, 为祖先节点的注意力系数的注意力权重,  为词语节点i的第k代祖先节点的集合, 为词语节点 的第k代祖先节点中第 个节点的下标表示;当 时, 为后裔节点的注意力系数, 为后裔节点的注意力系数的注意力权重, 为词语节点i的第k代后裔节点的集合, 为词语节点词语节点 的第k代后裔节点中的第 个节点的下标表示。

5.根据权利要求2所述的词嵌入表示方法,其特征在于,所述邻居节点包括祖先节点和后裔节点,所述获取不同代的所述邻居节点对所述词语节点的距离权重,包括步骤:获取所述祖先节点在距离传播中的可学习参数和所述后裔节点在距离传播中的可学习参数;

根据每代所述祖先节点在距离传播中的可学习参数和每代所述后裔节点在距离传播中的可学习参数以及预设的第二归一化函数,分别计算每代的所述祖先节点对所述词语节点的距离权重和每代的所述后裔节点对所述词语节点的距离权重,其中,所述预设的第二归一化函数如下:为第k代祖先节点的可学习参数, 为第i代祖先节点的可学习参数, 为第k代祖先节点对应的词语节点的距离权重, 为k代后裔节点的可学习参数, 为第i代后裔节点的可学习参数, 为第k代后裔节点对词语节点的距离权重, 为祖先节点代数或后裔节点代数的最大值。

6.根据权利要求2所述的词嵌入表示方法,其特征在于,所述邻居节点包括祖先节点和后裔节点,所述根据所述注意力权重、所述距离权重和预设的词嵌入表示传播策略,获取每个所述待表示词语的第二词嵌入表示,包括步骤:根据所述祖先节点的注意力权重、每代所述祖先节点的距离权重和预设的祖先节点词嵌入表示传播公式,得到每个所述待表示词语的第三词嵌入表示;其中,所述预设的祖先节点词嵌入表示传播公式如下:为词语节点i的第k代祖先节点的集合,当 时, 为节点的注意力系数的注意力权重, 为祖先节点的第一词嵌入表示,W为共享可学习参数矩阵,, 为第k代祖先节点对词语节点的距离权重, 为待表示词语的第三词嵌入表示, 为祖先节点代数或后裔节点代数的最大值;

根据所述待表示词语的第三词嵌入表示、所述后裔节点的注意力权重,每代所述祖先节点距离权重和预设的后裔节点词嵌入表示传播公式,得到每个所述待表示词语的第二词嵌入表示;其中,所述预设的后裔节点词嵌入表示传播公式如下:为词语节点i的第k代后裔节点的集合,当 时, 为后裔节点的注意力系数的注意力权重, 为待表示词语的第三词嵌入表示,W为共享可学习参数矩阵,, 为第k代后裔节点对词语节点的距离权重, 为待表示词语的第二词嵌入表示。

7.根据权利要求1所述的词嵌入表示方法,其特征在于,所述获取所述待表示词语对应的第一词嵌入表示,包括步骤:获取所述待表示词语的文本嵌入表示、视觉嵌入表示和听觉嵌入表示;

将所述文本嵌入表示、所述视觉嵌入表示和所述听觉嵌入表示进行拼接,得到所述待表示词语对应的第一词嵌入表示。

8.根据权利要求1所述的词嵌入表示方法,其特征在于,根据所述待表示词语所激活的大脑区域位置和所述待表示词语之间的从属关系,构建词语关系树,包括步骤:根据大脑区域位置与预设词语类别之间的对应关系,得到所述待表示词语的词语类别;

基于所述待表示词语的词语类别,获取所述词语关系树中第一层的词语节点集合;其中,每个所述词语类别对应一个所述词语集合,所述词语节点集合包括属于所述词语类别的待表示词语对应的词语节点;

根据所述待表示词语之间的从属关系,对每个所述词语节点集合内的词语节点继续分类,得到所述词语关系树。

9.一种词嵌入表示装置,其特征在于,包括:

第一获取单元,用于获取待表示词语、所述待表示词语所激活的大脑区域位置、所述待表示词语之间的从属关系以及所述待表示词语对应的第一词嵌入表示;

第一构建单元,用于根据所述待表示词语所激活的大脑区域位置和所述待表示词语之间的从属关系,构建词语关系树;其中,所述词语关系树包括所述待表示词语对应的词语节点、所述词语节点对应的第一词嵌入表示和所述词语节点之间的初始连接关系;

第二获取单元,用于根据所述词语节点之间的初始连接关系,获取每个所述词语节点的邻居节点;其中,所述邻居节点包括与所述词语节点直接连接的节点以及与所述词语节点间接连接的节点;

第二构建单元,用于将所述词语节点与所述邻居节点连接,得到所述词语关系树对应的词语关系图;

第一表示单元,用于基于所述词语关系图和预设的图注意力网络,获取所述词语关系图中每个所述待表示词语的第二词嵌入表示。

10.一种词嵌入表示设备,其特征在于,包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述方法的步骤。