利索能及
我要发布
收藏
专利号: 201911131232X
申请人: 陕西师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种计算机上执行的基于动态构图的半监督分类方法,所述方法针对基于图的半监督分类中,选边算法和相似度计算方法都具有各自的局限性,使得分类方法的结果不够准确的问题,其特征在于,所述方法包括如下步骤:S100、准备数据集,所述数据集包括已标记数据Xl和未标记数据Xu两部分,已标记数据Xl的标记信息为Fl,数据集中数据的特征通过数据属性信息来描述,l表示已标记数据的个数,将数据集中的数据抽象为m维空间上的n个节点,第i个节点表示为pi;

S200、在步骤S100准备的数据集上使用动态近邻DNN方法进行选边,得到邻接矩阵A,具体为:S201、计算所述数据集中节点间的欧氏距离,得到直接距离矩阵S;

S202、使用动态近邻DNN方法选择节点pi的D近邻,作为所选择的边,并根据D近邻生成邻接矩阵A,A是一个n×n的矩阵,邻接矩阵A中,若pj是pi的近邻,则矩阵中相应位置Aij的值为

1,否则为0,Aij表示邻接矩阵A中第i行第j列的值;

S300、对步骤S200中生成的邻接矩阵A使用ADW方法计算节点间的相似概率,得到亲和矩阵M,具体为:S301、根据步骤S201中的直接距离矩阵S和步骤S202中定义的邻接矩阵A定义距离矩阵S′,S′ij代表距离矩阵S′中第i行第j列的值,具体定义为:当i≠j时,

当i=j时,S′ij=0;

S302、根据步骤301中定义的距离矩阵S′定义权值矩阵W,权值矩阵W是一个n×n的矩阵,其中Wij用来描述节点pi和节点pj的相似度,即权值矩阵W第i行第j列的值;

S303、将步骤302中定义的权值矩阵W归一化后得到亲和矩阵M,亲和矩阵M是一个n×n的矩阵,其中Mij用来描述节点pi和节点pj相似的概率,即亲和矩阵M第i行第j列的值;

S400、根据步骤S300得到的亲和矩阵M进行标签传播得到最终的分类结果;

其中,所述步骤S100中的数据集包括合成数据集TwoSpirals、ToyData、FourGaussian、TwoMoon以及图像数据集USPS、Mnist、Mnist‑3495、Coil20、Coil(1500)、G241d、COIL2。

2.根据权利要求1所述的方法,所述步骤S201中,数据集中节点pi和pj之间的欧氏距离为:其中m表示数据的维度,pi、pj表示图中的第i、j个节点,xik和xjk分别是节点pi、pj第k维的坐标,根据节点间的欧氏距离生成直接距离矩阵S,直接距离矩阵S是一个n×n的二维矩阵,Sij表示矩阵中第i行第j列的值,存储节点pi和节点pj之间的欧氏距离。

3.根据权利要求2所述的方法,所述步骤S201还包括:

对直接距离矩阵S中的每个节点与其他节点的欧氏距离按从小到大的顺序进行排序得到矩阵O,同时生成其对应直接距离矩阵S的索引矩阵E,具体过程为,对于直接距离矩阵S中的第i行,将其存储的距离按从小到大的顺序排序,将排序为j‑1的距离存储在Oij中,同时将该距离在直接距离矩阵S中的位置存储在Eij中,由此通过索引矩阵E可以查找到矩阵O中存储的距离在直接距离矩阵S中的对应位置;矩阵O和索引矩阵E都是n×n的二维矩阵,Eij表示索引矩阵E的第i行第j列的元素。

4.根据权利要求3所述的方法,所述步骤S202中使用动态近邻DNN方法选择节点pi的D近邻具体采用代数方法:N(pi)表示pi的D近邻集合,在矩阵O中第i行第j列存储距离节点pi排序为j的距离,通过索引矩阵E可以查找到其在直接距离矩阵S中的位置Sim,即节点pm是到节点pi的距离排序为j的节点,将节点pm记为 判断 是不是pi的D近邻,判断准则为:将最近邻 加入到D近邻中,将 作为基准点,当 且 时, 是pi的近邻,否则 到都不是pi的最近邻,其中 为pi的最近邻, 表示距离pi排序为j的样本点,d(·)表示距离度量;再将 作为基准点,当 且 时, 是pi的近邻,再将作为基准点进行判断,以此类推,直到 不是pi的D近邻时停止判断,此时所得结果即为节点pi的D近邻,将pi与其D近邻的连线作为所选择的边。

5.根据权利要求3所述的方法,所述步骤S202中使用动态近邻DNN方法选择节点pi的D近邻具体采用几何方法:节点pi的D近邻查找过程:在矩阵O中第i行第j列存储距离节点pi排序为j的距离,通过索引矩阵E可以查找到其在直接距离矩阵S中的位置Sim,即节点pm是到节点pi的距离排序为j的节点,将节点pm记为 将最近邻 加入到D近邻中, 的中垂线将平面分为两个区域,根据 的中垂线来选择pi的D近邻所属的区域,即靠近pi这一侧为D近邻所属区域;从所述D近邻所属区域中选择距离pi最近的近邻,即 根据 的中垂线来选择pi的新D近邻所属的区域,即靠近pi这一侧为新D近邻所属区域,在这个区域中选择距离pi最近的点 加入并作为下一个基准点,如此循环直到由所有中垂线构成的靠近pi的区域变成封闭区域,此封闭区域内的所有节点就是pi的D近邻,将pi与其D近邻的连线作为所选择的边。

6.根据权利要求1所述的方法,所述步骤S302中,权值矩阵W定义为:Wij=deg(pi)S′ij

其中pi为图上的节点,Wij表示权值矩阵W中第i行第j列的值,deg(pi)为节点的度,S′ij表示节点pi和节点pj的距离,即距离矩阵S′中第i行第j列的值。

7.根据权利要求1所述的方法,所述步骤S303中定义了亲和矩阵M,具体为:根据权值矩阵W,使用如下公式计算对角矩阵T:

Tii=∑jWij

其中Tii表示对角矩阵T第i行第i列的值,Wij表示权值矩阵W第i行第j列的值;

使用如下公式归一化后得到亲和矩阵M:

‑1/2 ‑1/2

M=T WT

其中T是对角矩阵,W是权值矩阵,M是亲和矩阵。

8.根据权利要求1所述的方法,所述步骤S400中的标签传播通过局部和全局一致性LLGC方法,计算方法如下:‑1

F=(I‑αM) Y

其中F是一个n×c的矩阵,n为节点个数,c为标签的种类数,Fij表示节点pi标记为第j类标签的概率,即矩阵F第i行第j列的值;I是单位矩阵,α为调节参数,M是亲和矩阵,Y为标记信息,它是一个n×c的矩阵,其中存储每个节点的标记信息,Yij为矩阵Y第i行第j列的值,若‑1节点pi的标记为第j类标签,则Yij=1,否则Yij=0;(I‑αM) 是每个节点获取标记节点标签的概率;

最终得到节点pi的标记信息,具体为:

其中Fij是矩阵F第i行第j列的值,argmax代表将当Fij取得最大值时的j赋值给yi,即节点pi的标记即为yi,对所有节点获得标记后即完成数据的分类。