1.一种基于对偶局部一致的约束稀疏概念分解的聚类方法,用于文本聚类,其特征包括:S10获取待聚类样本形成待聚类样本数据集;
S20针对所述待聚类样本数据集构建邻接矩阵;
S30建立基于概念分解的目标函数JDESCFS;
其中,X=[x1,x2,...,xn]为由待聚类样本数据集构建的邻接矩阵,W为基矩阵,其中,AT n×c w×c=[Al;Au]=[a1,a2,...,an]∈R 是一个标签矩阵,Al∈R 表示已标记样本的类别,Au∈R(n‑w)×c c×d c×1表示未标记样本的类别,Z∈R 是一个辅助矩阵,ai∈R 中最大元素所在位置表示样本xi所属的类别,R表示实数集;α为特征空间局部一致性正则化参数,β为类别空间局部一致性正则化参数,λ为稀疏参数,Tr(·)为矩阵的迹;L为权重图的拉普拉斯矩阵且L=D‑S,D为一个对角矩阵,其是边权矩阵Sij的行或列的和,即Dii=∑jSij;
S40根据所述目标函数使用迭代加权的方法迭代预设次数,对基矩阵W、标签矩阵A和辅助矩阵Z进行更新;
S50采用K‑Means聚类算法对系数矩阵V进行聚类分析,其中,V=AZ。
2.如权利要求1所述的聚类方法,其特征在于,在步骤S40中,基矩阵W、标签矩阵A和辅助矩阵Z的更新规则分别为:基矩阵W的更新规则为:
标签矩阵A的更新规则为:
辅助矩阵Z的更新规则为:
T
其中,K=XX,