利索能及
我要发布
收藏
专利号: 2019104297467
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-03-28
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.面向混合采样工业大数据的基于多视图字典学习分类方法,其特征在于,设A={A1,...,Ak,...,AH}表示一个包含H个以不同采样频率采集的训练样本集,且每个采样频率数据Ak有C个类簇,则第k个采样频率数据样本为 其中 表示第i个类簇的数据样本,z={z1,...,zk,...,zh}表示一个包含h个以不同采样频率采集的测试样本,zk表示第k个采样频率数据的测试样本,D={D1,...,Dk,...,DH}和X={X1,...,Xk,...,XH}分别表示重构对应样本的字典矩阵和编码系数矩阵,则 和 分别表示第k个采样频率数据第i个类簇的数据样本 在字典Dk和子字典 上的编码系数矩阵。包括以下阶段步骤:A、在训练阶段,通过迭代优化求解下面的目标函数,获得(1)对应第k个采样频率数据第i个类别的子字典 (2)原始数据的每个类簇样本 在字典Dk上的编码系数矩阵 训练过程目标函数如下:

上述目标函数包含三项,第一项 为判别保真项,约束字典对类簇样本的重构能力,其应该遵循以下三个原则:第一,对于第k个采样频率数据,字典Dk应该具备重构样本 的能力,即最小化误差项 第二,与第i类样本相关的子字典 应该具备重构样本 的能力,即最小化误差项 第三,与第i类样本相关的其他类

簇子字典 不应具备重构样本 的能力,所以应该最小化重构误差项 从而使第i类子字典 对样本 重构所占比重最大,判别保真项公式如下:目标函数第二项为L1范数约束编码系数矩阵Xk的列向量,使其稀疏化,λ1是一个调节参数;第三项为判别系数项f(Xk),以Fisher判别准则约束编码系数矩阵Xk使其更具判别信息,即约束编码系数矩阵Xk,使类内散度SW(Xk)最小化,使类间散度SB(Xk)最大化,λ2是一个调节参数。判别系数项公式如下:其中,tr(·)表示求矩阵的迹,SW(Xk)和SB(Xk)分别表示编码系数矩阵Xk的类内散度和类间散度,η表示一个调节参数。类内散度和类间散度计算公式如下:其中, 和mk分别表示第k个采样频率数据第i类编码系数矩阵 和Xk的均值向量,xw表示 的列向量, 是样本 的样本数量。

B、在分类阶段,分类过程具体包括步骤:

步骤1,通过求解下面的优化函数,获得测试样本z={z1,...,zk,...,zh}在与对应采样数据相关的字典D={D1,...,Dk,...,Dh}上的编码向量v={v1,...,vk,...,vh},vk表示第k个采样频率测试样本zk在字典Dk上的编码向量,β是一个调节参数。分类阶段目标函数如下:步骤2,利用测试样本z在对应字典Dk(k=1,...,h)上的编码向量vk(k=1,...,h)和训练得到的类簇子字典 计算重构测试样本z的误差,如下:其中, 表示与第k个采样频率第i个类簇样本相关的编码向量, 表示由训练阶段学习的第k个采样频率第i个类编码系数矩阵 的均值向量,w是一个调节参数。

步骤3,根据 判断测试样本在哪一类子字典上重构误差最小,

则面向混合采样工业大数据的基于多视图字典学习的分类方法将测试样本z归到第i类。

2.根据权利要求1所述的面向混合采样工业大数据的基于多视图字典学习分类方法,其特征在于,所述训练阶段A整个迭代优化算法,采用变量交替更新优化策略,当更新第k(k=1,2,...H)个采样频率数据对应的变量时,其他采样频率数据的对应变量固定;对于第k个采样频率数据,Xk和Dk交替更新。

3.根据权利要求2所述的面向混合采样工业大数据的基于多视图字典学习分类方法,其特征在于,所述训练阶段A整个迭代优化算法具体包括:Step1:初始化每个采样频率数据对应子字典 遍历带标签的混合采样数据Ak(k=

1,...,H)的每个采样频率数据对应的类簇数据,用主成分分析方法PCA初始化每个采样频率数据对应子字典 即Step2:固定字典矩阵Dk,用迭代投影算法逐类更新编码系数矩阵 即

Step3:固定编码系数矩阵Xk,用逐列更新算法更新字典矩阵 即

Step4:对每个采样频率数据,循环迭代Step2至Step3,直到目标函数收敛或达到最大迭代次数,输出每个采样频率数据对应的字典Dk和对应的编码系数矩阵Xk。

4.根据权利要求3所述的面向混合采样工业大数据的基于多视图字典学习分类方法,其特征在于,所述迭代优化算法中,所述Step2更新编码系数矩阵Xk过程具体包括步骤:目标函数简化为与 相关的函数:通过迭代投影算法,在目标函数未收敛或迭代次数未达到时,按如下公式更新其中,t表示迭代次数, 表示与 相关的函数,但不包含L1范数项,为 在 处的导数,Sτ/δ(·)是一个软阈因子公式,计算如下:

Sτ/δ(X)=sign(X)max(abs(X)-τ/δ,0)

δ表示迭代步长参数,τ为λ1/2,sign(·)和abs(·)分别表示符号函数和求绝对值函数,max(a,b)表示求a和b中较大值。

5.根据权利要求3所述的面向混合采样工业大数据的基于多视图字典学习分类方法,其特征在于,所述迭代优化算法中,所述Step3更新字典矩阵Dk过程具体包括步骤:目标函数可以简化为与 相关的函数:通过逐列更新算法,即将上述关于 的函数转换成关于 的每个列向量dj的函数,再求导对子字典 矩阵进行逐列更新。