利索能及
我要发布
收藏
专利号: 202510450586X
申请人: 齐鲁工业大学(山东省科学院)
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于解耦操作的不平衡性标记分布学习方法,其特征在于:包括以下步骤:S1、构建包括编码器Ⅰ、Ⅱ和Ⅲ的不平衡性标记分布学习网络,编码器Ⅰ、Ⅱ分别基于输入的特征向量和标记分布获取特征编码表示和全局标记分布;编码器Ⅲ用于对输入的标记分布初次解耦后的数据编码,获得优势及非优势标记分布;解码器用于对特征编码表示和全局标记分布进行解码,获取预测和真实标记分布;对预测标记分布进行二次解耦,得到预测的优势类标记分布和非优势类标记分布;

S2、基于特征编码表示、优势标记分布和非优势标记分布,分别计算优势和非优势标记分布信息对齐损失;基于特征编码表示、全局标记分布以及余弦相似性分别构建特征相似性矩阵以及标记相似性矩阵,基于这两个矩阵,计算特征与标记表示相似性矩阵对齐损失;

基于预测标记分布与真实标记分布计算对齐损失;基于预测的优势类标记分布、非优势类标记分布及真实标记分布分别计算优势标记分布损失和非优势标记分布损失;利用参数α、β、γ和λ平衡上述各损失,得到总优化损失;

S3、基于训练集和总优化损失对不平衡性标记分布学习网络进行训练,得到网络模型;

其中,步骤S3包括S3‑1获取训练集和测试集,步骤S3‑1具体包括以下具体步骤:S3‑1‑1、获取原始数据集,其中,原始数据集为Movie数据集;Movie数据集是关于用户对电影的评分数据集,每部电影的评分标记分布通过各评分等级的百分比计算得出;

S3‑1‑2、使用十倍交叉验证法将原始数据集分成10个子集,其中9个子集中均包括775个特征向量及其对应的标记分布,剩余的那个子集中包括780个特征向量及其对应的标记分布;

S4、基于待预测的不平衡数据集获取特征向量和标记分布,而后分别输入网络模型中前向传播一次,得到预测标记分布及真实标记分布。

2.根据权利要求1所述的一种基于解耦操作的不平衡性标记分布学习方法,其特征在于:步骤S1中,初次解耦和二次解耦的步骤相同,初次解耦对输入的标记分布进行解耦,二次解耦对预测标记分布进行解耦,二次解耦具体包括如下步骤:将预测标记分布中优势标记描述度记为1,其他标记描述度记为0,得到优势类标记分布;将预测标记分布中优势标记描述度记为0,将非优势标记利用 softmax 进行归一化处理使非优势标记的描述度总和为1,得到非优势标记分布。

3.根据权利要求1所述的一种基于解耦操作的不平衡性标记分布学习方法,其特征在于:步骤S2具体包括如下步骤:S2‑1、将特征编码表示和优势标记分布利用KL散度计算优势标记分布信息对齐损失Lalig1;

S2‑2、将特征编码表示和非优势标记分布利用KL散度计算非优势标记分布信息对齐损失Lalig2;

S2‑3、对特征编码表示的方差σfeature添加噪声δfeature,而后再与特征编码表示的均值μfeature通过重参数化,进行如(1)所示的计算,生成特征表示rfeature;

= +

rfeatureμfeatureσfeatureδfeature,δfeature~N(0,1)         (1)式(1)中,N(0,1)表示标准正态分布;

而后,使用余弦相似性计算第m个实例相对应的特征表示  和第 n 个实例相对应的特征表示 之间的相似度,而后,基于上述相似度构建二维特征相似性矩阵Amn;

对全局标记分布的方差σwhole添加噪声δwhole,而后再与全局标记分布的均值μwhole通过重参数化,进行如(2)所示的计算,生成全局标记分布表示rlabelDis;

= +

rlabelDisμwholeσwholeδwhole,δwhole~N(0,1)       (2)式(2)中,N(0,1)表示标准正态分布;

而后,使用余弦相似性计算第m个实例相对应的特征表示 和第 n 个实例相对应的特征表示 之间的相似度,而后,基于上述相似度构建二维标记相似性矩阵Zmn;

将矩阵Amn和Zmn利用KL散度计算特征与标记表示相似性矩阵对齐损失Lalig3;

S2‑4、将预测标记分布与真实标记分布利用KL散度进行对齐,计算预测标记分布与真实标记分布对齐损失Lalig4;

S2‑5、将预测的优势类标记分布与真实标记分布利用KL散度进行对齐,计算优势标记分布损失LDDL;将预测的非优势类标记分布与真实标记分布利用KL散度进行对齐,计算非优势标记分布损失LNDDL。

4.根据权利要求1所述的一种基于解耦操作的不平衡性标记分布学习方法,其特征在于:步骤S3中,基于训练集和总优化损失对不平衡性标记分布学习网络进行10个训练段的训练,得到10个网络模型。

5.根据权利要求4所述的一种基于解耦操作的不平衡性标记分布学习方法,其特征在于:步骤S3还包括以下步骤:S3‑2、将训练集中的特征向量输入编码器Ⅰ、将标记分布输入编码器Ⅱ以及编码器Ⅲ中,前向传播,计算不平衡性标记分布学习网络的总优化损失,在总优化损失的引导下进行反向传播,更新不平衡性标记分布学习网络的权重参数,完成一个epoch的训练过程,迭代

300 个epoch的训练过程后即完成一个训练段的训练,得到一个不平衡性标记分布学习网络模型;训练不平衡性标记分布学习网络的过程中,训练10个训练段。

6.根据权利要求5所述的一种基于解耦操作的不平衡性标记分布学习方法,其特征在于:基于待预测的不平衡数据集获取特征向量和标记分布,而后分别输入10个网络模型中前向传播一次,得到10个预测标记分布及10个相对应的真实标记分布。