利索能及
我要发布
收藏
专利号: 2023102268589
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-13
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多视图邻域证据熵的肺炎CT影像属性约简方法,其特征在于,包括如下步骤:S10、读取肺炎CT影像数据集,并将数据集转化为一个四元组决策信息系统;

S20、通过稀疏表示和距离度量两个视图表示肺炎CT影像数据样本之间的相关性,并通过融合和删除两阶段刻画邻域范围;

S30、将证据理论和邻域熵融合,构造邻域证据熵,用于刻画肺炎CT影像数据的属性重要度;

S40、计算肺炎CT影像数据集中的属性约简集合。

2.根据权利要求1所述的基于多视图邻域证据熵的肺炎CT影像属性约简方法,其特征在于,所述步骤S10包括如下步骤:S11、读取肺炎CT影像数据集,确定其属性集和决策分类,所述决策信息系统S=,其中U={x1,…,xi,…,xN}表示肺炎CT影像数据的样本集,N表示肺炎CT影像的个数,xi表示第i个样本,xN表示第N个样本;C={a1,…,ai,…,an}表示肺炎CT影像数据属性的非空有限集,n表示肺炎CT影像数据中的属性个数,ai表示第i个属性,an表示第n个属性;D={d1,…,di,…,dm}表示肺炎CT影像数据决策属性的非空有限集,m表示肺炎CT影像数据中的决策类别个数,di表示第i个决策类别,dm表示第m个决策类别;V=∪a∈C∪DVa,Va是肺炎CT影像数据属性a的可能情况;f:U×(C∪D)→V是一个信息函数,它为每个CT影像赋予一个信息值,即S12、根据数据集中决策属性D的不同信息值个数,将所述肺炎CT影像数据集S划分为t个数据子集,且满足 其中Si表示第i个数据子集,Sj表示第j个数据子集,i≠j,i=1,2,…,t,j=1,2,…,t。

3.根据权利要求1所述的基于多视图邻域证据熵的肺炎CT影像属性约简方法,其特征在于,所述步骤S20包括如下步骤:S21、将肺炎CT影像数据集设置为X,X的重构权重矩阵为W,通过稀疏约束函数计算待考察样本xi和其它样本{x1,x2,…,xi‑1,xi+1,…,xN}之间的稀疏相关性,待考察样本xi的目标函数如下:其中,xi‑1表示第i‑1个样本,xi+1表示第i+1个样本, 是Frobenius范数的平方,F是范数的选取方式,||·||1是1范数,T是矩阵的转置变换,η和μ是取值为0到1之间的参数,RT T(W)=Tr(WXLXW)为局部保持投影正则化项,其中,L是拉普拉斯矩阵,表示属性之间的关系信息,Tr是矩阵的迹,即该矩阵对角线元素之和;

S22、根据肺炎CT影像数据集重构得到的权重矩阵W,看出样本间的稀疏相关性,若稀疏相关性大于0,则认为该两个样本间呈正相关关系,将其放入稀疏邻域集合中,并记呈正相关关系样本的个数为k,对于 样本xi由稀疏表示得到的稀疏邻域集合SNA(xi)定义如下:

SNA(xi)={xj|xj∈U,W(xi,xj)>0}

其中,A表示在数据属性非空有限集C中的属性子集,xj表示第j个样本,W(xi,xj)表示xi和xj之间的稀疏相关权重值;

S23、计算肺炎CT影像样本xi和其它样本xj之间的欧氏距离dis(xi,xj),其定义如下:其中,f(x,at)表示样本x在第t个属性at中的值;

S24、根据欧氏距离和k值,采用k近邻思想,即根据距离选取前k个邻居,求解距离邻域集合,对于 样本xi由k近邻得到的距离邻域集合KNA(xi)定义如下:

其中, 表示距离xi的第n个样本, 表示离xi最近的第n个样本的距离;

S25、将由肺炎CT影像数据的稀疏邻域集合和距离邻域集合进行融合,得肺炎CT影像数据集的多视图邻域集合MNA(xi),即:MNA(xi)={xj|xj∈SNA(xi)∪xj∈KNA(xi)}

S26、对融合后的邻域集合进行一阶删减操作,计算肺炎CT影像数据集中的样本xi与其邻域集合中的样本xj的平均距离,记为ave,比较dis(xi,xj)和ave之间的大小关系,若dis(xi,xj)>ave,则认为样本xj与样本xi之间不满足一阶邻域关系,将样本xj从xi的多视图邻域集合中删除,对于 样本xi经过第一次删除后得到的一阶邻域集合为其计算公式如下:

S27、根据中垂线定理,对肺炎CT影像数据集中样本的一阶邻域集合进行二阶操作,删除不满足二阶要求的样本,使用垂直平分线来确定邻域集合中的样本xj是否存在于垂直平分线靠待考察样本xi的一侧,对邻域集合中的所有样本进行计数,如果样本xj在待考察样本xi的一侧,则数值保持不变,否则数值增加1,计数结束,则认为数值最大的样本与待考察样本xi之间不满足二阶邻域关系,被视为冗余样本,将冗余样本删除后,得到肺炎CT影像数据样本的二阶邻域集合,根据中垂线定理,对于 样本xi经过第二次删除后得到的二阶邻域集合为 删减的定义如下:

其中,count表示根据垂直平分线计算样本xj是否与待考察样本xi在同一侧的数值,n'表示待考察样本xi的一阶邻域集合中的数量, 表示根据垂直平分线计算xi一阶邻域中的样本不在待考察样本xi同一侧的最大值。

4.根据权利要求1所述的基于多视图邻域证据熵的肺炎CT影像属性约简方法,其特征在于,所述步骤S30包括如下步骤:S31、计算肺炎CT影像数据集中的待考察第p个样本xp和其它第q个样本xq之间的距离p,q p,q p,q p,qdis(xp,xq)和稀疏表示W(xp,xq),分别表示为dis 和spa ,根据dis 和spa 计算肺炎CT影像样本xp的二阶邻域S32、计算肺炎CT影像数据集中的其它样本xq为待考察样本xp提供的证据信息,Ω=U/D={D1,D2,...,Dj}为肺炎CT影像数据集的决策类划分集,其中,j为决策划分的个数,Dj为第j个决策类划分,如果肺炎CT影像样本xq的类别标签为lt和决策类划分为Dt,那么(xq,Dt)独立地为待考察样本xp提供证据支持,其所包含的证据信息 定义如下:其中,Dt为第t个决策类划分,w1和w2表示距离度量和稀疏表示的重要性权重占比,w1+w2=1,μ是距离度量的相关参数,η是稀疏表示的相关参数,且满足μ>0和η>0;

S33、计算肺炎CT影像样本xp的二阶邻域 中类别标签为lt的样本集为样本集 对xp的证据支持表示为 即:

S34、计算肺炎CT影像样本xp在不同类别标签下的证据信息 并对证据信息进行合并操作,其具体表示为:其中, j为决策划分的个数;

S35、计算肺炎CT影像样本xp对决策类划分Ω=U/D={D1,D2,...,Dj}中的Dt类的信任函数 具体定义如下:S36、计算肺炎CT影像样本xp的邻域证据熵H(D|A),xp的二阶邻域集合为[xp]D是xp的一个等价类,则邻域证据熵的定义如下:

其中,|U|为论域的个数。

5.根据权利要求1所述的基于多视图邻域证据熵的肺炎CT影像属性约简方法,其特征在于,所述步骤S40包括如下步骤:S41、计算肺炎CT影像数据集中的每个病理属性 相对于约简集red的外部重要度度量sigout(red,a,D)=H(D|red)‑H(D|red∪{a}),选择具有最大属性重要度对应的属性ak;

S42、判断sigout(red,ak,D)是否大于0,若满足sigout(red,ak,D)>0,则将属性ak加入约简集red中,并在候选属性子集C中进行删除;

S43、计算并比较H(D|red)和H(D|C),如果H(D|red)≥H(D|C)并且sigout(red,ak,D)≤0,则将属性ak从约简集red中删除,直到S44、对于约简集red中的每个属性 分别再次计算其属性内部重要度度量,sigin(red,aw,D)=H(D|red‑{aw})‑H(D|red),依次删除属性aw,比较sigin(red,aw,D)是否大于0,如果sigin(red,aw,D)≤0,则将属性aw从约简集red中删除,对red中的所有属性依次循环遍历后,输出肺炎CT影像数据集的约简集red。