利索能及
我要发布
收藏
专利号: 2023106510011
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于大规模认知障碍疾病检测的动态加权属性约简方法,其特征在于,包括以下步骤:

S1、大规模认知障碍疾病数据获取与预处理,具体如下:

获取样本人群大脑的静息态功能磁共振成像图像,基于静息态功能磁共振成像构建脑功能连接网络;将脑功能连接网络数据进行预处理,并转换为一个四元组决策信息表S,存入HDFS文件系统;将获得的增量样本数据转换为一个四元组决策信息表S′,定义如下:S={U,C∪D,V,f},其中U={x1,x2,...,xN}表示认知障碍疾病数据集中的患者对象集合,N表示认知障碍病历数据的总数;S′={U′,C∪D,V,f},其中U′={x′1,x′2,...,x′M}表示增量认知障碍病历数据中的患者对象集合,M表示新增认知障碍病历数据的总数;C表示认知障碍病历中条件属性的非空有限集;D表示认知障碍病历中决策属性的非空有限集,且 其中D=1表示患者存在认知障碍,其中D=0表示患者不存在认知障碍;V=Ua∈C∪DVa,Va是认知障碍病历中脑功能连接网络关系属性a的可能情况;f→U×(C∪D)是一个信息函数,为每个认知障碍病历赋予一个信息值,即 x∈U,f(x,a)∈Va;

S2、计算认知障碍疾病原始数据和增量数据的知识粒度,具体如下:

采用数据分片技术,将HDFS文件系统中增量的决策信息表S'均分为k份S′={S′1,S′2,...,S′k},并分发到各计算子节点上,在各个子节点上分别计算增量决策信息表Si'中条件属性集C相对于决策属性D的知识粒度 和原约简属性集B相对于决策属性D的知识粒度 其中U′i表示第i个增量决策信息表S′i中认知障碍患者对象集合,若

知识粒度相等,则直接输出约简属性集B,否则继续S3;

S3、构建动态特征交互加权属性树,对所有属性进行聚类生成多棵树的根节点,并对根节点中属性进行权重初始化,具体如下:在计算节点上,对加入的增量大规模数据子集S′i的所有条件属性C执行K‑means聚类算法,根据属性与属性之间相关性及属性与属性子集之间的相关性将所有条件属性集C划分成多个属性子集{C1,C2,...,Cj,...,Cn},n是聚类后的属性子集数量,其中Cj表示第j个属性子集,包含着相关性较高的一组条件属性,将每一个属性子集Cj作为一棵权属性树根节点进行分支;

S4、将构建的动态特征交互加权属性树分支,每轮分支结束时将低权重属性添加到交互集F中进行增量特征交互,具体如下:初始化分支系数α;根据各属性ai与决策属性D的互信息与不同属性之间的互信息,计算各加权树根节点中所有属性的权重;根据属性的权重对各加权属性树进行子节点的划分,将权重值最大的属性W(aMAX)划分到右子节点MAXW中,并在每轮分支结束时添加到约简子集B中;将权重值最小的属性W(aMIN)划分到左子节点MINW中,并在每轮分支结束时添加到交互集F中进行增量特征交互;将剩余属性进行下一轮的属性树分支与特征交互;

S5、在所有属性树完成分支后,将计算节点约简集输出到主节点,获得大规模认知障碍疾病数据约简,具体如下:在各个计算节点上,完成有属性树全部分支以及特征交互,将所有计算节点得到的约简子集Bi输出到Spark主节点上,Bi表示第i个计算节点得到的约简子集,并将所有计算节点的约简子集{B1,B2,...,Bk}作交集操作得到最终约简集。

2.根据权利要求1所述一种用于大规模认知障碍疾病检测的动态加权属性约简方法,其特征在于,所属步骤S2的具体步骤如下:S2.1、计算认知障碍疾病增量数据子集S′i中条件属性集C相对于决策属性D的知识粒度计算公式如下:其中, 为增量数据子集S′i中条件属性C的知识粒度,U′i为第i个增量数据子集S′i中的所有数据样本,其计算公式如下:其中,增量数据子集S′i中所有的数据样本U′i关于条件属性集C的划分为U′i/C={X1,X2,...,Xi,...,Xm},Xi表示类别为i的数据样本集合,m表示样本类别总数,符号|·|表示集合中的元素个数;

为增量大规模数据子集S′i中全部属性C∪D的知识粒度,其计算公式如下:

其中,计算认知障碍疾病增量数据集中所有的数据样本U′i关于所有属性C∪D的划分为U′i/(C∪D)={Y1,Y2,...,Yi,...,Yh},Yi表示类别为i的数据样本集合,h表示样本类别总数,符号|·|表示集合中的元素个数;

S2.2、对于认知障碍疾病增量大规模数据子集S′i,计算原约简属性集B相对于决策属性D的知识粒度 计算公式如下:S2.3、判断知识粒度 和 是否相等,若知识粒度相等,则直接输出

原约简集B,否则继续步骤S4。

3.根据权利要求1所述一种用于大规模认知障碍疾病检测的动态加权属性约简方法,其特征在于,所属步骤S4的具体步骤如下:S4.1、将分支系数α其初始化为1,并设定最大阈值αmax,阈值αmax是属性树的最大分深度,设置为属性树根节点中最大的属性数量;

S4.2、在各个子节点上每一轮树形分支过程中,计算每个属性ai的特征权重W(ai),计算公式如下:其中,I(ai,D)表示属性ai与决策属性D的互信息,具体计算公式如下:

p(ai)表示属性ai的概率密度,p(D)表示决策属性D的概率密度,p(ai,D)表示属性ai与决策属性D的联合概率密度, 表示属性ai可能取值的集合,SD表示属性D可能取值的集合;

I(ai,aj)表示不同属性ai与aj的互信息,具体计算公式如下:

p(ai)表示属性ai的概率密度,p(aj)表示属性aj的概率密度,p(ai,aj)表示属性ai与属性aj的联合概率密度, 表示属性ai可能取值的集合, 表示属性aj可能取值的集合;

S4.3、根据属性的权重对各加权属性树进行子节点的划分,将权重值最大的属性W(aMAX)划分到右子节点MAXW中,并在每轮分支结束时添加到约简子集B中;

S4.4、将权重值最小的属性W(aMIN)划分到左子节点MINW中,并在每轮分支结束时添加到交互集F中;

S4.5、交互集F和约简子集B中的属性进行增量特征交互,计算每个属性与决策属性D的互信息I(ai,D),并找到互信息值最大的属性amax,其中ai表示交互集F中的第i个属性,如果满足条件I(B∪amax,D)>I(B,D),则将amax从交互集F中删除并添加进约简集B;

S4.6、在交互集F内的属性进行特征交互,计算属性集amax∪ak与决策属性D之间的互信息I(amax∪ak,D),如果满足条件I(amax∪ak,D)>0,则将amax添加进约简集B,否则计算属性集F∪amax∪ak与决策属性D之间I(F∪amax∪ak,D),如果满足条件I(F∪amax∪ak,D)>I(F,D),则将属性amax和ak添加进约简集B中;

S4.7、比较分支系数α与最大阈值αmax,若分支系数α小于最大阈值αmax,则将剩余属性继续进行下一轮的属性树分支与特征交互,跳转到步骤S4.2,若分支系数α大等于最大阈值αmax,程序跳转到步骤S5。