利索能及
我要发布
收藏
专利号: 2020112411895
申请人: 中山大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于局部均值距离约束表示的数据分类方法,其特征在于:所述的方法包括步骤如下:S1:获取训练样本集合,所述训练样本集合包括若干个类别,将训练样本集合按照类别分为若干个训练样本子集,计算未知样本到每个训练样本子集中的训练样本的距离;

S2:从每个类别中找到距离未知样本最近的k个训练样本,组成一个邻居样本子集;

S3:采用基于协同表示的目标函数,实现邻居样本子集对未知样本的重新表示;

S4:在基于协同表示的目标函数中加入局部均值向量进行约束,得到新的目标函数,新的目标函数能使不同类别在表示未知样本时相互竞争;

S5:对步骤S4得到的新的目标函数进行求导,求解表示系数;

S6:将表示系数作为每个邻居样本的权重,计算每个类别邻居样本的权重和;

S7:将未知样本分类为系数和最大的类别,得到未知样本的类别;

S8:判断未知样本集合中的未知样本是否全部分类完毕,若全部分类完毕,则结束分类;若还有未知样本没有完成分类,则回到步骤S2进行执行,实现对下一个未知样本的分类。

2.根据权利要求1所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S1,将包括n个训练样本,c个类别的训练样本集合表示为:X=[X1,X2,...,Xc];其中,表示在第i类中的ni个训练样本组成的训练样本子集;

计算未知样本到每个训练样本子集中的训练样本的距离,其计算公式如下:式中,i=1,2,...,c;t=1,2,...,ni;y表示未知样本。

3.根据权利要求2所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S2,根据距离从每个类别中找到距离未知样本最近的k个训练样本,有c个类别,所以得到c·k个训练样本,并将c·k个训练样本组成一个邻居样本子集 表示为

4.根据权利要求3所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S3,使用邻居样本子集 对未知样本进行重新表示,具体如下:式中,γ表示可调的正则化参数;S为表示系数; 代表向量二范数的平方,定义为表示用邻居样本子集重构出的训练样本与未知样本y之间的残差向量; 表示残差向量中各元素的平方和,用来表示使用邻居样本重构出的训练样本和未知样本本身的差距。

5.根据权利要求4所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S4,在基于协同表示的目标函数中加入局部均值向量进行约束,得到新的目标函数,所述的新的目标函数具体公式如下:其中,sj表示在邻居样本子集 中第j个邻居样本的表示系数,γ1和γ2均为可调的正则化参数,在实际运用过程中通过交叉验证得到;uj表示第j个邻居样本所属类别的k个邻居样本的局部均值向量,其中j=1,2,...,N;uj在同一个类别中是相同的,对于每一个类别,ui表示为:其中,i=1,2,...,c,xih表示第i个类别中距离未知样本最近的第h个训练样本。

6.根据权利要求5所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S5中,对步骤S4得到的新的目标函数进行求导,求解表示系数,具体如下:对于新的目标函数式(3),

前两项的求导结果为: 和2γ1S;

对于第三项,令

对S中的每一项sj求导,通过求解 得到

因此,

综上,对于新的目标函数,对S求导的结果为

求得表示系数 如下:

7.根据权利要求6所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S6,计算每个类别邻居样本的权重和,具体如下:其中, 表示第i类的第h个邻居样本的表示系数。

8.根据权利要求7所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S7,将未知样本分类为系数和最大的类别,具体计算如下:cy=argmax Wi      (9)

式中,i=1,2,...,c。