利索能及
我要发布
收藏
专利号: 2020110793490
申请人: 广东石油化工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于选择性伪标记子空间学习的跨项目缺陷预测方法,其特征在于,所述基于选择性伪标记子空间学习的跨项目缺陷预测方法包括:计算映射矩阵;

计算基于最近邻预测伪标记置信度;

计算基于结构预测伪标记置信度;

选择置信度高的伪标记对目标数据进行标记,判断是否全部目标数据进行标记,若未标记完全返回计算映射矩阵步骤。

2.如权利要求1所述的基于选择性伪标记子空间学习的跨项目缺陷预测方法,其特征在于,所述更新映射矩阵具体包括:(1),通过最小化目标函数学习最优变换矩阵P,最小化目标函数如下:其中相似性矩阵 为目标数据以及已经被标记的目标数据,通过变换上目标函数变为:

其中L=D-W, D为对角阵,上述目标以被转换为对下公式求特征项问题:(2),用 表示源项目第i个原始数据, 表示目标项目的第i个原始数据,其中表示处理后源项目第i个数据,其中 表示处理目标项目第i个数据。

3.如权利要求1所述的基于选择性伪标记子空间学习的跨项目缺陷预测方法,其特征在于,所述计算基于最近邻预测伪标记置信度具体包括下述步骤:

1),计算源数据y类的数据中心 计算公式如下:其中当 当

2),计算基于最近邻预测伪标记置信度pnnp(y|xt),计算公式如下:其中|c|表示类的数目。

4.如权利要求1所述的基于选择性伪标记子空间学习的跨项目缺陷预测方法,其特征在于,所述计算基于结构预测伪标记置信度具体按照下述步骤进行:(a),使用K-means对集群zt进行聚类,利用源项目类别中心进行初始化,然后将目标项目中的簇与源项目中的类进行匹配,使匹配对的距离之和最小化。目标函数如下:其中,对于任意的i, 对于任意的j, L表示表示源项目和目标项目之间的平均相似性;进行求解,当Bij=1意味着源项目i与目标项目j的标签相同,得到目标项目的标签;

(b),计算基于结构预测伪标记置信度psp(y|xt),计算公式如下:

5.如权利要求1所述的基于选择性伪标记子空间学习的跨项目缺陷预测方法,其特征在于,所述选择置信度高的伪标记对目标数据进行标记,判断是否全部目标数据进行标记,若未标记完全返回计算映射矩阵步骤,具体按照下述步骤进行:(i),结合基于最近邻预测伪标记以及基于结构预测伪标记得到最终的标签,计算公式如下:逐步选择在k次迭代中具有高置信度的kn/T目标实例,其中T是迭代次数;

(ii),将进行标记的目标项目数据加入到 对 进行更新,当依然存在未标记目标数据时,回到更新映射矩阵。

6.一种基于选择性伪标记子空间学习的跨项目缺陷预测系统,其特征在于,所述基于选择性伪标记子空间学习的跨项目缺陷预测系统包括:映射矩阵运算模块,用于计算映射矩阵;

最近邻预测伪标记置信度运算模块,用于计算基于最近邻预测伪标记置信度;

结构预测伪标记置信度运算模块,用于计算基于结构预测伪标记置信度;

全部目标数据标记判读模块,用于选择置信度高的伪标记对目标数据进行标记,判断是否全部目标数据进行标记,若未标记完全返回计算映射矩阵步骤。

7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:计算映射矩阵;

计算基于最近邻预测伪标记置信度;

计算基于结构预测伪标记置信度;

选择置信度高的伪标记对目标数据进行标记,判断是否全部目标数据进行标记,若未标记完全返回计算映射矩阵步骤。

8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:计算映射矩阵;

计算基于最近邻预测伪标记置信度;

计算基于结构预测伪标记置信度;

选择置信度高的伪标记对目标数据进行标记,判断是否全部目标数据进行标记,若未标记完全返回计算映射矩阵步骤。