利索能及
我要发布
收藏
专利号: 2024111119304
申请人: 江苏科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种数控编程领域知识图谱的补全方法,其特征在于,包括以下步骤:(1)数据集采样模块对CAM知识图谱三元组进行负采样,生成负例三元组;

(2)实体邻域信息聚合模块引入多头自注意力机制聚合邻域特征,通过注意力函数学习基于关系路径的多跳领域实体相对于中心实体的重要性,最终得到节点在各层的聚合特征,捕捉CAM知识图谱中的结构信息;

(3)全局语义特征学习模块将数控编程过程中各个环节的制造信息进行词嵌入,生成CAM语义知识图谱,应用GCN对其迭代学习与优化,生成实体的全局语义特征;包括以下步骤:(31)利用CAM软件提供的API函数,从数控编程案例中抽取零件工艺信息、特征尺寸信息、加工操作信息并分类存储于数据库中;

(32)基于抽取的CAM制造语义信息建模语义知识图谱,并迭代学习以获得实体的最优全局语义信息嵌入,使用Tokenization对CAM文本信息进行分词,组合词嵌入总和、段落和位置嵌入,作为BERT模型的输入表示;

(33)将经过预处理的文本数据输入预训练BERT模型中,获取文本信息的编码表示;

BERT模型输出每个词向量的隐藏状态,使用隐藏状态表示实体初始语义嵌入;

(34)使用KNN创建初始语义知识图谱,通过余弦相似性来测量每个实体的语义特征之间的相似性,并进行相似度排序,保留前K个语义特征,将其值设置为1,其余值为0,其计算过程如式(9)所示:

0 0

其中,S和A分别是初始语义知识图谱的相似性矩阵和邻接矩阵, 表示按降序排列时 在相似性矩阵 第i行中的位置;

(35)利用GCN对创建的初始语义知识图谱进行编码以获得实体表示,使用加权的余弦相似性算法计算实体对的语义相似性,通过不同的权重计算独立的相似性值;其中每个权重代表实体每一部分语义信息,其计算过程如下:其中,Sij是实体对的相似性得分; 是两个实体向量在第n个方面的余弦相似性,其每个方面表示实体对语义特征的每个部分;wn是可学习的权重向量;⊙表示哈达玛乘积;

* (0)

(36)将经过语义相似性学习后补充的语义知识图谱G与初始语义知识图谱G 相融合,生成表现实体语义特征最佳的语义知识图谱 其融合过程如下式所示:* (n) (1)

G=μf(G )+(1‑μ)f(G )(13)

(0) (n) (1)

其中,Μ是G 的邻接矩阵;G 和G 分别是第n次和第一次迭代优化后的语义知识图* (0) *谱;将G 和G 线性组合,通过对超参数μ加权以获得最终学习后的语义知识图谱;在融合G(0)和G 时,使用权衡超参数λ平衡它们的占比;

(37)利用双层GCN编码,对语义特征Vs进行两次矩阵变换,输出最优的全局语义特征;其输出计算过程如式(14)所示:(0) (1)

其中,W 和W 为可训练的特定层权重矩阵;σ(·)是ReLU激活函数; 是全局语义特征模块输出的全局语义特征矩阵;

(4)链接预测模块融合实体关系交互模块的特征向量和全局语义特征,在得分函数计算下进行候选三元组得分排序,得出最佳预测结果。

2.根据权利要求1所述的一种数控编程领域知识图谱的补全方法,其特征在于,步骤(1)公式如下:三元组负采样即随机替换三元组(h,r,t)中的头尾节点,如式(1)所示:其中,S表示正例三元组集合;表示负例三元组集合;ε表示实体集; 和 表示选择替换头实体h和尾实体t后生成的负例三元组;在生成负样本的时候,替换关系r会生成错误的负例三元组,替换方式不能纳入负例三元组集合,如式(2)所示:混合采样模块将获得的负例三元组集进行标记,引入正例三元组集,将两者以一定的混合系数进行混合,采用基于边界距离的损失函数作为训练目标来优化模型,损失函数如式(3)所示:其中,函数f(h,r,t)定义如下:

f(h,r,t)=‑||h+r‑t||1  (4)

其中,γ表示正负样本之间的间距,当 大于0时,损失函数取原值,反之取0,旨在使最相似的正负例三元组之间距离最大化。

3.根据权利要求1所述的一种数控编程领域知识图谱的补全方法,其特征在于,步骤(2)具体如下:首先,将实体 和关系 作为输入,聚合基于关系 的所有多跳邻域实体,如式(5)所示:其中, 表示基于关系r和中心实体i的实体集合, 表示第l层的第j个实体,H表示聚合的邻域实体特征;通过注意力函数学习邻域实体相对于中心实体的重要性,如下式所示:其中, 为注意力打分,衡量了实体i和实体j在关系路径r下的相关性或重要性; 值越大,表示实体j相对实体i在关系r上的影响越大;αT表示注意力向量的转置,Wn为权重矩阵,用于实体特征 和 的线性变换,||表示对实体i和实体j变换后的特征进行拼接; 为注意力权重,表示实体j对实体i的重要性,应用softmax函数将注意力打分转化为概率分布,使得所有领域实体的注意力权重和为1;基于关系路径r的实体i领域实体聚合方法如下式所示:其中, 表示在关系路径r下,实体i在第l层的所有邻域实体聚合特征; 表示在关系路径r下,实体i的领域实体数量;K表示多头注意力的头数,通过多头注意力机制对领域实体的特征进行加权求和,最终得到实体i在第l层的聚合特征。

4.根据权利要求1所述的一种数控编程领域知识图谱的补全方法,其特征在于,步骤(4)具体如下:使用可学习的参数α优化每个三元组向量与语义特征的聚合过程,在训练过程中以线性变换的方式进行随机初始化和迭代更新,最终得到融合数控编程文本信息的CAM三元组集;,其中,0≤|α|≤1;计算过程如下:使用Adam优化器对SIE‑KGC模型进行优化,以最小化损失函数作为最终训练目标,损失函数公式如下:其中,yi是缺失三元组信息的实体关系对(u,r);N是CAM知识图谱中实体的数量; 是sigmoid函数。