利索能及
我要发布
收藏
专利号: 2023105913848
申请人: 青岛科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.融合多通道语义信息与标签协作的Web服务类别标签推荐方法,其特征在于,包括以下步骤:步骤A、爬取Web服务;

步骤B、对Web服务描述进行数据清洗,构建服务功能向量:步骤B1、建立多通道词向量语义特征提取模型,生成包含不同粒度窗口大小的局部语境特征信息的聚合词向量ct;

通过多种卷积核构造CNN卷积层网络,构建不同长度特征词的语义信息提取通道,每个通道均输入经过RoBERTa预训练的词向量vt;经不同通道处理,使得最终生成的聚合词向量ct中包含不同粒度窗口大小的局部语境特征信息:ct=ReLU(Con·Vt:t+h‑1+b)                 (1)d*h

其中,Vt:t+h‑1∈R 是以第t个词为中心词、长度为h的词向量矩阵,d表示词向量vt的维度,b为偏置向量;

步骤B2、建立多通道句向量语义特征提取模型MCFRASRU,为服务描述文本生成兼顾局部与全局语境特征的服务功能向量sfv(s);

步骤B21、构建带有快速注意力机制的SRU++模型:FRASRU,为聚合词向量ct进一步聚合上下文关联特征,生成具有全局语境特征的全局词向量hwt:步骤B22、将hwt与ct拼接作为第t个词的最终词向量,并基于注意力机制为服务描述文本信息生成当前通道中的文本向量;

步骤B23、将服务描述文本信息在不同通道中产生的文本向量求均值,为Web服务生成融合多通道语义信息的服务功能向量;

步骤C、确定Web服务标签集,构建标签协作向量:

步骤C1、依据服务标签之间的协作关联,构建Web服务的标签协作关联图;

步骤C2、设计带有标签组合流行度修正的游走策略,在有偏游走概率的基础上设计一种融入标签组合流行度的结点游走概率计算方法;

步骤C3、将融入标签组合流行度的结点游走概率策略与Node2vec模型相结合,为标签协作关联图中的每个结点对应的标签生成初始协作向量;

步骤C4、建立融合边权计算注意力的图注意力网络LCGAT,输出最终的标签协作向量;

步骤D、结合服务功能向量和标签协作向量,实现Web服务类别标签输出。

2.根据权利要求1所述的融合多通道语义信息与标签协作的Web服务类别标签推荐方法,其特征在于:所述步骤B21通过以下方式实现:将SRU++中自注意力机制替换为快速规则近似注意力机制,从每个词的正反两个方向对词进行功能语义建模,正向语义向量为ht1,反向语义向量为ht2,将二者拼接得到词wt的全局语境特征的全局词向量hwt:hwt=[ht1||ht2]        (12)其中,“||”表示向量拼接。

3.根据权利要求1所述的融合多通道语义信息与标签协作的Web服务类别标签推荐方法,其特征在于:所述步骤B22,鉴于服务描述中的每个词在生成服务功能向量时的重要性不同,通过注意力机制计算词对服务功能向量构建的贡献度,每个词的权重向量ut为:ut=tanh(Mg[hwt||ct]+bg)                   (13)其中,Mg为可学习参数矩阵,tanh()为激活函数,bg为偏置向量,对权重向量归一化得到每个词的注意力权重:将每个位置的词向量与对应的注意力权重αt相乘,求和得到服务描述sd在当前通道中的文本向量sv(sd):sv(sd)=∑tαt[hwt||ct]                   (15)其中,hwt为全局语境特征的全局词向量。

4.根据权利要求1所述的融合多通道语义信息与标签协作的Web服务类别标签推荐方法,其特征在于:所述步骤B23中最终的服务功能向量为sfv(s):其中,s为Web服务,m为语义通道的数量,j=1,2,3…m,sd为服务描述文本信息,svj(sd)为s在第j个通道的文本向量。

5.根据权利要求1所述的融合多通道语义信息与标签协作的Web服务类别标签推荐方法,其特征在于:所述步骤C2中,具体采用以下方式:(1)在原始Node2vec中,对于结点vi,其对于下一跳结点vj的概率参考公式:其中,πvivj是结点vi和vj之间的未归一化转移概率,z是归一化常数,πvivj=apq(i,j)·wi,j,其中wi,j是结点vi和vj之间的边权,apq(i,j)由公式(18)计算:其中,di,j表示结点vj和vi之间最短的路径距离,q和p是用于定义结点之间转移概率的两个超参数;

(2)计算标签组合流行度:

其中,Ns(l)为包含标签l的Web服务数量,公式(19)中分子为标签li与lj所隶属的Web服务总和,Is(li)与Is(lj)分别表示包含标签li与lj的Web服务,L为服务类别标签集合;

(3)将标签组合流行度融入Node2vec的有偏随机游走概率中,修改后的转移概率为:Node2vec在进行随机游走时,利用标签组合流行度对游走概率进行修正。

6.根据权利要求1所述的融合多通道语义信息与标签协作的Web服务类别标签推荐方法,其特征在于:所述步骤C中,具体采用以下方式实现:(1)在GAT模型中,对标签协作图中的结点vi计算其与一阶邻居结点的相似度系数:ei,j=a(W1ui,W2uj),j∈Ni                    (21)F×F

其中,ui、uj为vi与邻居结点vj的协作关联向量,W1、W2∈R ′为可训练矩阵,F与F′分别为当前层初始化向量维度与输出维度,a为共享注意力机制系数;

(2)构造当前层偏置向量:

l l’ l

其中,bw为当前层偏置向量,b w为上一层的偏置向量,Ww为可训练权重矩阵,ui为当前层结点vi的向量表示;

(3)将偏置向量与边权wi,j结合融入到注意力计算过程得到新的注意力系数:由此,根据多头注意力机制,在最后一层得到vi对应标签li的最终协作向量lcv(li):k k

其中,σ为sigmoid激活函数,ai,j是由第k个注意力机制(a)计算的归一化注意力系数,kW是相应的输入线性变换的权重矩阵。

7.根据权利要求1所述的融合多通道语义信息与标签协作的Web服务类别标签推荐方法,其特征在于:所述步骤D包括以下步骤:(1)将服务s的服务功能向量sfv(s)与第j个标签的协作向量lcv(lj)通过MLP层,得到标签lj出现在服务s标签集合中的标签预测概率:p(s,lj)=sigmoid(W1sfv(s)+W2lcv(lj)+b)             (25)其中,W1与W2为可训练权重矩阵,b为偏置项;

(2)给定标签集合L={l1,l2,…,lj,…,ln},L中的标签隶属于服务s标签集合的标签预测概率集合为{p(s,l1),p(s,l2),…,p(s,lj),…,p(s,ln)},采用二元交叉熵损失函数训练模型:其中,Ys={ys,l1,ys,l2,…,ys,lj,...,ys,ln}表示服务s的真实标签,n为标签总数,若lj∈L存在于s的标签列表中,对应ys,lj设值为1,否则设值为0,p(s,lj)为公式(25)中的标签预测概率;

(3)在进行标签推荐时,令PYs={pys,l1,pys,l2,…,pys,lj,...,pys,ln}为服务s的标签预测集合,若p(s,lj)≥0.5,视标签lj为正例,存在于s的标签列表,对应pys,lj设值为1;若p(s,lj)<0.5,视标签lj为负例,不存在于s的标签列表,对应pys,lj设值为0。