利索能及
我要发布
收藏
专利号: 2021102780224
申请人: 中山大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于决策树分类器的跳数矩阵恢复方法,其特征在于:所述的方法包括步骤如下:S1:通过泛洪过程,获取的跳数矩阵 中含有缺失项;

S2:根据跳数矩阵 中部分被观测到的跳数之间的关系构建训练集,将跳数矩阵中观测到的跳数值建模为训练集的标签,最大跳数值表示为类别数;

S3:根据步骤S2得到的训练样本集合训练决策树分类器;

S4:为没有观测到的跳数值构造特征,得到未知样本;将未知样本输入到训练好的决策树分类器,得到未知样本的类别,即得到矩阵中对应位置的缺失的跳数值,从而恢复出完整的跳数矩阵H;

步骤S4,具体地,

S401:若跳数矩阵 中某个位置的跳数值没有被观测到,则进行下一步;否则遍历跳数矩阵 中下一个值;

S402:跳数缺失的两个节点分别用节点i和节点j表示,相对于网络中其他所有的节点k,k=1,2,…,n,计算节点i到节点k的跳数值 和节点k到节点j的跳数值 的跳数之和的最小值,作为未知样本的第一个特征;

S403:计算节点i的邻居节点到节点j的跳数,和节点j的邻居节点到节点i的跳数的平均值,作为未知样本的第二个特征;

S404:将构造的未知样本的第一个特征、第二个特征组成一个未知样本,输入到训练好的决策树分类器,得到未知样本的类别,即得到该位置的跳数值;

S405:若没有完成对跳数矩阵 的遍历,则遍历矩阵中下一个值,并返回步骤S401;若遍历完跳数矩阵 得到恢复后的跳数矩阵;

构建所述的未知样本,表达如下:

其中, 表示节点i到节点k的跳数值 和节点k到节点j的跳数值 之和的最小值。

2.根据权利要求1所述的基于决策树分类器的跳数矩阵恢复方法,其特征在于:构造建立任意节点i的跳数向量:hi={hi1,hi2,…,hin},其中,hij表示节点i和节点j之间的跳数值;

i=1,…,n;j=1,…,n;

所述的缺失的跳数矩阵 表示为式(2):

其中,⊙表示Hadamard乘积;Ω=[ωij]n*n是一个二元矩阵;ωij表示跳数矩阵对应位置是否缺失,表示为:

3.根据权利要求2所述的基于决策树分类器的跳数矩阵恢复方法,其特征在于:在步骤S1之后,步骤S2之前,如果缺失的跳数的对称位置被观测到,使用对称位置跳数将其补齐。

4.根据权利要求3所述的基于决策树分类器的跳数矩阵恢复方法,其特征在于:步骤S2,具体的步骤如下:S201:对跳数矩阵 进行遍历,若某个位置跳数值被观测到,则进行下一步;否则遍历跳数矩阵 中下一个值;

S202:跳数缺失的两个节点分别用节点i和节点j表示,相对于网络中其他所有的节点k,k=1,2,…,n,计算节点i到节点k的之间跳数值 和节点k到节点j之间的跳数值 的跳数和的最小值,作为训练样本的第一个特征;

S203:计算节点i的邻居节点到节点j的跳数,和节点j的邻居节点到节点i的跳数的平均值,作为训练样本的第二个特征;

S204:将被观测到的跳数作为类别,加上构造的样本的第一个特征和第二个特征形成一个训练样本,加入到训练样本集合中;

S205:遍历整个跳数矩阵 遍历结束后,得到训练样本集合。

5.根据权利要求4所述的基于决策树分类器的跳数矩阵恢复方法,其特征在于:步骤S203,具体的,初始化两个邻居列表Li和Lj,根据跳数向量 选择节点i的邻居,根据跳数向量 选择节点j的邻居;节点i的邻居节点的索引和节点j的邻居节点的索引分别存储在对应的邻居列表Li和Lj中;变量ni表示节点i的可用邻居节点数,变量nj表示节点j的可用邻居节点数;如果观察到邻居节点Li(k)与节点j之间的跳数 则可用邻居节点ni加1;

其中,训练样本的第二个特征的计算方式如式(4):

(4)。

6.根据权利要求5所述的基于决策树分类器的跳数矩阵恢复方法,其特征在于:构建所述的训练样本集合,表达如式(5):其中, 表示第m个训练样本的第一个特征, 表示第m个训练样本的第二个特征,cm∈{1,2,…,hmax}表示第m个训练样本的类别,m=1,2,…,N。

7.一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述的处理器执行所述的计算机程序时,实现如权利要求1~6任一项所述的方法的步骤。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述的计算机程序被处理器执行时,实现如权利要求1~6任一项所述的方法的步骤。