1.一种基于局部均值距离约束表示的数据分类方法,其特征在于:所述的方法包括步骤如下:S1:获取训练样本集合,所述训练样本集合包括若干个类别,将训练样本集合按照类别分为若干个训练样本子集,计算未知样本到每个训练样本子集中的训练样本的距离;
S2:从每个类别中找到距离未知样本最近的k个训练样本,组成一个邻居样本子集;
S3:采用基于协同表示的目标函数,实现邻居样本子集对未知样本的重新表示;
S4:在基于协同表示的目标函数中加入局部均值向量进行约束,得到新的目标函数,新的目标函数能使不同类别在表示未知样本时相互竞争;
S5:对步骤S4得到的新的目标函数进行求导,求解表示系数;
S6:将表示系数作为每个邻居样本的权重,计算每个类别邻居样本的权重和;
S7:将未知样本分类为系数和最大的类别,得到未知样本的类别;
S8:判断未知样本集合中的未知样本是否全部分类完毕,若全部分类完毕,则结束分类;若还有未知样本没有完成分类,则回到步骤S2进行执行,实现对下一个未知样本的分类。
2.根据权利要求1所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S1,将包括n个训练样本,c个类别的训练样本集合表示为:X=[X1,X2,...,Xc];其中,表示在第i类中的ni个训练样本组成的训练样本子集;
计算未知样本到每个训练样本子集中的训练样本的距离,其计算公式如下:式中,i=1,2,...,c;t=1,2,...,ni;y表示未知样本。
3.根据权利要求2所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S2,根据距离从每个类别中找到距离未知样本最近的k个训练样本,有c个类别,所以得到c·k个训练样本,并将c·k个训练样本组成一个邻居样本子集 表示为
4.根据权利要求3所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S3,使用邻居样本子集 对未知样本进行重新表示,具体如下:式中,γ表示可调的正则化参数;S为表示系数; 代表向量二范数的平方,定义为表示用邻居样本子集重构出的训练样本与未知样本y之间的残差向量; 表示残差向量中各元素的平方和,用来表示使用邻居样本重构出的训练样本和未知样本本身的差距。
5.根据权利要求4所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S4,在基于协同表示的目标函数中加入局部均值向量进行约束,得到新的目标函数,所述的新的目标函数具体公式如下:其中,sj表示在邻居样本子集 中第j个邻居样本的表示系数,γ1和γ2均为可调的正则化参数,在实际运用过程中通过交叉验证得到;uj表示第j个邻居样本所属类别的k个邻居样本的局部均值向量,其中j=1,2,...,N;uj在同一个类别中是相同的,对于每一个类别,ui表示为:其中,i=1,2,...,c,xih表示第i个类别中距离未知样本最近的第h个训练样本。
6.根据权利要求5所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S5中,对步骤S4得到的新的目标函数进行求导,求解表示系数,具体如下:对于新的目标函数式(3),
前两项的求导结果为: 和2γ1S;
对于第三项,令
对S中的每一项sj求导,通过求解 得到
因此,
令
综上,对于新的目标函数,对S求导的结果为
求得表示系数 如下:
7.根据权利要求6所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S6,计算每个类别邻居样本的权重和,具体如下:其中, 表示第i类的第h个邻居样本的表示系数。
8.根据权利要求7所述的基于局部均值距离约束表示的数据分类方法,其特征在于:步骤S7,将未知样本分类为系数和最大的类别,具体计算如下:cy=argmax Wi (9)
式中,i=1,2,...,c。