利索能及
我要发布
收藏
专利号: 202010653407X
申请人: 西南大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于迁移样本的跨域迁移电子鼻漂移抑制方法,其特征在于:按照以下步骤进行:S1:电子鼻获取源域数据集和目标域数据集;

该目标域数据集包括未知标签目标域数据集、已知标签目标域数据集将源域数据集、目标域数据集投影到子空间,得到该两个数据集从原始空间经过转换基P投影到子空间的投影源域数据集、投影目标域数据集;

该投影目标域数据集包括投影未知标签目标域数据集、投影已知标签目标域数据集;

S2:对子空间中投影源域数据集和投影目标域数据集的边缘最大均值差异做最小化处理,得到最小化投影后边缘最大均值差异公式;

对子空间中投影源域数据集和投影已知标签目标域数据集的条件最大均值差异做最小化处理,得到最小化投影后条件最大均值差异公式;

为了使投影源域数据集和投影目标域数据集更具有可分性,增强类内紧密性和类间离散性,计算投影源域数据集和投影已知标签目标域数据集的类内离散度矩阵和类间离散度矩阵,得到投影源域数据集和投影目标域数据集可分性最大化计算公式;

对投影源域数据集和投影目标域数据集的判别信息做最大化处理并简化,得到最大化投影源域数据集判别信息公式和最大化投影目标域数据集判别信息公式;

S3:将步骤S2得到的公式进行合并,得到数据从原始空间投影到子空间的转换基P的求解公式;

S4:根据步骤S3得到的数据从原始空间投影到子空间的转换基P的求解公式,对其进行优化并增加求解约束条件,得到优化约束后的数据从原始空间投影到子空间的转换基P的求解公式,从而得到数据从原始空间投影到子空间的最优转换基P以及投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集;

S5:根据步骤S4得到的投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集,用投影源域数据集和投影已知标签目标域数据集计算域适应极限学习机的输出权重,得到最终的域适应极限学习机;并将电子鼻投影目标域未知标签数据进行漂移抑制测试。

2.根据权利要求1所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法,其特征在于:在步骤S1中,所述源域数据集为

所述目标域数据集

目标域数据集中的迁移样本数据集为 源域数据集样本个数分别为NS;目标域数据集样本个数分别为NT;数据维数为D, 表示将数据从原始空间投影到维数为d的子空间的转换基;

投影源域数据集为

投影目标域数据集为

符号||·||2表示2范数,Tr(·)表示求矩阵迹的运算,(·)T表示转置矩阵;

在步骤S2中,最小化投影后边缘最大均值差异公式为:μS代表子空间中投影源域数据集的中心;μT代表子空间中投影目标域数据集的中心;

表示子空间学习后投影源域数据集的第i个样本;其中,表示子空间学习后投影目标域数据集的第j个样本;其中:为原始空间中源域数据集的第i个样本, 为原始空间中目标域数据集的第j个样本;将公式(2)、(3)带入公式(1),得到:uS表示原始空间源域数据集的中心;

uT表示原始空间目标域数据集的中心;

所述最小化投影后条件最大均值差异公式为:表示投影源域数据集第c类样本的第i个样本;

表示原始空间源域数据集第c类样本的第i个样本;

表示投影目标域迁移样本数据集第c类样本的第k个样本;

表示原始空间目标域迁移样本数据集第c类样本的第k个样本;

表示目标域迁移样本数据集第c类样本的个数;

表示源域数据集第c类样本的个数;

μS.c表示子空间中第c类投影源域数据的中心;

表示子空间中第c类投影目标域迁移样本数据的中心;

uS.c表示原始空间中第c类源域数据的中心;

表示原始空间中第c类目标域迁移样本数据的中心;

投影源域数据集和投影目标域数据集可分性最大化计算公式表示投影目标域迁移样本数据的中心;

表示原始空间目标域迁移样本数据的中心;

为投影源域数据集类间离散度矩阵;

为投影源域数据集类内离散度矩阵;

为原始空间源域数据集类间离散度矩阵;

为原始空间源域数据集类内离散度矩阵;

表示投影目标域迁移样本数据集类间离散度矩阵;

表示投影目标域迁移样本数据集类内离散度矩阵;

表示原始空间目标域迁移样本数据集类间离散度矩阵;

表示原始空间目标域迁移样本数据集类内离散度矩阵;

所述最大化投影源域数据集判别信息公式为:所述最大化投影目标域数据集判别信息公式为:其中,YT=PTXT,YS=PTXS,则公式(8)简化得到:公式(9)简化得到:

3.根据权利要求2所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法,其特征在于:在步骤S3中,将式子(4)(5)(6)(7)(10)(11)合并得到的所述数据从原始空间投影到子空间的转换基P的求解公式为:其中,λ0,λ1,λ2,λ3,λ4,λ5是权衡参数。

4.根据权利要求3所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法,其特征在于:数据从原始空间投影到子空间的转换基P的求解公式中存在数据从原始空间投影到子空间的转换基P的至少一个可行解,为了保证P的解的唯一性,在该最优化问题上加上等价约束,得到:其中,ε为一正常数;拉格朗日函数如下:其中,α表示拉格朗日乘子;

把 对数据从原始空间投影到子空间的转换基P的偏导数置为0,可得到:从(15)中,可得到如下特征值分解问题:其中,

α表示特征值,P是与特征值对应的特征向量,其中数据从原始空间投影到子空间的最优转换基P即前d个最小特征值对应的特征向量:P*=[P1,P2,…,Pd]                           (17)则求得:

投影源域数据集为YS=P*TXS;                  (18-1)投影目标域数据集为YT=P*TXT;                (18-2)投影已知标签目标域数据集为

表示原始空间目标域迁移样本数据集, 表示投影已知标签目标域数据集。

5.根据权利要求4所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法,其特征在于:步骤S5中域适应极限学习机为:

其中, 为投影目标域数

据集中第k个未知标签的样本 的域适应极限学习机隐层输出,k=1,...,NTu;NTu表示目标域中未知标签的样本个数;βS为域适应极限学习机分类输出权重;wi表示域适应极限学习机第i个隐层神经元的输入权重,bi表示域适应极限学习机第i个隐层神经元的偏置,i=1,

2,...,L;L为域适应极限学习机隐层神经元个数;g表示域适应极限学习机隐层神经元的激活函数; 为域适应极限学习机判断出的投影目标域数据集中第k个未知标签的样本的类别标签,也就是原始空间中目标域数据集中第k个未知标签的样本 的类别标签;计算分类输出权重βS存在:其中, 和 分别表示投影源域数据集第i个样本的隐层输出、预测误差和标签;

和 分别表示投影已知标签目标域数据集第j个样本 的隐层输出、预测误差和标签;

表示要求解的分类输出权重,L即隐层神经元的个数;

NS和 分别表示投影源域数据集的样本个数和投影目标域已知标签数据集的样本个数,CS和 分别表示关于投影源域数据和投影目标域已知标签数据集的训练误差的惩罚因子;

对公式(20)使用拉格朗日乘子法和偏微分法,可分别得到两种情况的解;当训练样本数NS小于L时,解可被表示为:其中,HS和HT分别定义为投影源域数据集和投影目标域已知标签数据集的隐层输出矩阵;

I是大小为NS的单位矩阵;

当训练样本数NS大于L时,解可被表示为:其中,I为大小为L的单位矩阵。