利索能及
我要发布
收藏
专利号: 2023108104192
申请人: 青岛科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-07
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于特征语义增强与图对比学习的Mashup服务聚类方法,其特征在于,包括以下步骤:步骤A、从服务注册平台爬取Mashup服务和Web服务,对获得的服务进行数据清洗,构建适用于聚类的数据集;

步骤B、构建基于特征语义增强的服务功能向量;

步骤B1、基于奇异值分解与标准化的空间分布校正方法,生成Mashup服务功能向量;

步骤B2、基于非功能性实体词增强服务功能向量的特征语义的方法,使用命名实体识别方法抽取描述文本中的非功能性实体词,构建特征语义增强向量;

步骤B3、将步骤B2实体词形成的特征语义增强向量与步骤B1的Mashup服务功能向量拼接,得到特征语义增强的Mashup服务功能向量;

步骤C、在步骤B的基础上,结合爬取的Mashup服务与Web服务,建立两种面向共享依赖的Mashup服务关联图:共享标签关联图T_MAG和共享Web服务关联图S_MAG,并构建融合标签关联邻域特征的服务功能向量和融合Web服务关联邻域特征的服务功能向量;

步骤D、将步骤C中两种关联图中生成的向量通过infoNCE损失函数优化,构建Mashup服务表征向量,并利用谱聚类算法,实现Mashup服务聚类。

2.根据权利要求1所述的基于特征语义增强与图对比学习的Mashup服务聚类方法,其特征在于:所述步骤B1具体采用以下方式实现:(1)利用BERT模型为Mashup服务生成功能向量,输出m*n的矩阵A,其中m为服务功能向量的数量,n为其维度;

(2)对矩阵A进行奇异值分解,并对获得的奇异值从大到小进行排序,取排名前一半的奇异值对应的特征向量,构建A的降维矩阵A′;

(3)对矩阵A′中的每一行向量进行z‑score标准化处理,对于Mashup服务mi,其对应的服务功能向量为hfi:其中ai∈A为从服务描述di中提取的功能向量,ai(mean)为功能向量中分量的平均值,ai(s)为功能向量中分量的标准差,hfi为校正后的Mashup服务功能向量。

3.根据权利要求2所述的基于特征语义增强与图对比学习的Mashup服务聚类方法,其特征在于:所述步骤B2具体采用以下方式实现:(1)设mi.d={w1,w2,…,wn}∈D为一个Mashup服务的描述文本,对mi.d中的组成词语进行词性标注,构建当前Mashup服务mi的非功能性实体词集合NFW,记为mi.NFW={nfw1,nfw2,...,nfwk};

(2)对于Mashup服务mi,使用Word2vec为NFW中的非功能性实体词向量化,生成实体词向量集合HW,记为mi.HW={hw1,hw2,...,hwk},并引入自注意力机制,获取每个实体词向量在特征语义增强向量中所占的注意力权重,将所有实体词向量与其注意力权重加权求和,得到服务mi的特征语义增强向量:其中,hnfwi为特征语义增强向量,hwj为mi.HW中的实体词向量,aw‑hwj为其注意力权重。

4.根据权利要求1所述的基于特征语义增强与图对比学习的Mashup服务聚类方法,其特征在于:所述步骤C中构建共享标签关联图和共享Web服务关联图具体采用以下方式:定义标签共享:若存在标签t,使得t∈mi.T∩mj.T,则称Mashup服务mi与服务mj存在共享标签关联,记作:mi~mj;

定义Web服务共享:若存在Web服务s,使得s∈mi.S∩mj.S,则称Mashup服务mi与服务mj存在共享Web服务关联,记作:定义面向标签共享的Mashup服务关联图:

面向标签共享的Mashup服务关联图为一个无向加权图T_MAG=(V,E,W),其中:(1)V={v1,v2,…,vm}为Mashup服务结点集合,结点vi表示Mashup服务mi;

(2)E={eij}为共享标签关联边集合,eij=(vi,vj)∈E表示结点vi与vj所对应的Mashup服务mi和mj满足mi~mj;

(3)W={wij}为边eij的权值集合,权值为Mashup服务mi与mj共同标签的数量;

定义面向Web服务共享的Mashup服务关联图:

面向Web服务共享Mashup服务关联图为一个无向加权图S_MAG=(V,E,W),其中:(1)V={v1,v2,…,vm}为Mashup服务结点集合,结点vi表示Mashup服务mi;

(2)E={eij}为共享Web服务关联边集合,eij=(vi,vj)表示结点vi与vj所对应的Mashup服务mi和mj满足(3)W={wij}为边的权值集合,权值为Mashup服务mi与mj共同调用Web服务的数量。

5.根据权利要求1所述的基于特征语义增强与图对比学习的Mashup服务聚类方法,其特征在于:所述步骤C中构建融合标签关联邻域特征的服务功能向量和融合Web服务关联邻域特征的服务功能向量的原理如下:建立融合结点与序列二阶图注意力的网络模型SOGAN,使用Node2vec的广度游走遍历方式采样结点序列,建立结点‑序列二阶注意力机制,聚合结点在单一序列中的邻域结点特征和结点在不同序列中的上下文结构特征,优化服务结点的图嵌入向量生成。

6.根据权利要求5所述的基于特征语义增强与图对比学习的Mashup服务聚类方法,其特征在于:所述步骤C中,对于面向共享依赖的Mashup服务关联图T_MAG采用以下步骤进行处理:(1)采用Node2vec,以广度游走遍历的方式进行结点采样,优先将功能相似度高的结点纳入结点序列,对于结点vi,分别为其生成T_MAG下的广度游走序列集合T(vi);

(2)构建包含结点级与序列级的二阶注意力机制,结点vi从序列集合T(vi)中生成嵌入向量的过程如下:首先,通过结点级注意力层,优化vi在T(vi)的每个序列中的向量,对于其中第q个序列中的结点vj,计算vj对vi的结点级注意力权重;将第q个序列中每个结点对vi的结点级注意力权重与其对应特征增强的服务功能向量加权求和,得到第q个序列中的vi经结点级注意力优化的向量;

然后,通过序列级注意力层,得到vi的最终表征输出Tui:

计算每个序列的注意力权重,第q个序列的序列向量定义为序列内所有服务经结点级注意力优化后的向量均值,将T(vi)中每个序列的注意力权重与其序列向量加权求和,即实现对vi的二阶注意力优化,获得融合标签关联邻域特征的服务功能向量Tui:其中, 表示归一化后得到第h个序列对vi的序列级注意力权重, 是第h个序列的序列向量,为序列内所有服务经结点级注意力优化后的向量均值;

采用同样处理方法获得vi在S_MAG中融合Web服务关联邻域特征的服务功能向量Sui。

7.根据权利要求1所述的基于特征语义增强与图对比学习的Mashup服务聚类方法,其特征在于:所述步骤D中,基于图对比学习生成服务表征向量:(1)构建Mashup服务的正负样本对:设Mashup服务总数为Nm,对于Mashup服务mi,将mi在步骤C的T_MAG中生成的向量Tui和S_MAG中生成的向量Sui组合为正样本对(Tui,Sui),将Tui与其他Mashup服务对应的共享标签关联邻域特征的服务功能向量Tuj组成负样本对,形成负样本对集合{(Tui,Tuj)},其中1<=i,j<=Nm,且i≠j;

(2)模型训练,得到服务表征向量

采用infoNCE损失函数迭代更新可训练参数,当损失函数收敛,得到Mashup服务mi的表征向量mrvi。