利索能及
我要发布
收藏
专利号: 2023115772085
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-13
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种面向精神分裂症的双通道模糊信息粒与特征选择方法,其特征在于,包括如下步骤:S10、读取精神分裂症数据集,并将数据集转化为一个四元组决策信息系统;

S20、根据两种不同的粒度表示形成模糊相似关系,其一是将稀疏表示和双向策略融合形成,其二是根据距离度量构造模糊凸半球形成;

所述步骤S20包括如下步骤:

S21、将精神分裂症数据集设置为X,X的重构权重矩阵为W,通过稀疏约束函数计算待考察样本xi和其它样本{x1,x2,…,xi‑1,xi+1,…,xN}之间的稀疏相关性;

S22、根据精神分裂症数据集重构得到的权重矩阵W,看出样本间的稀疏相关性,该值的取值范围为[‑1,1],将W矩阵设定为模糊相关性值,故对于 由稀疏表示得到的样本xi与xj的模糊相似关系Rsp(xi,xj)定义如下:其中,Rsp(xi,xj)表示xi和xj之间由稀疏表示得到的模糊相似关系,W(xi,xj)表示xi和xj之间的稀疏相关权重值;ε表示模糊参数;

S23、判断精神分裂症数据集的稀疏模糊相似关系是否满足双向策略,即同时满足Rsp(xi,xj)≠0和Rsp(xj,xi)≠0,由稀疏表示和双向策略融合得到的模糊相似关系表示为Rsm(xi,xj);

S24、对精神分裂症数据的每个决策j,j=1,2,…,m,m表示精神分裂症数据中的决策类别个数,取中心样本点S25、计算精神分裂症样本xi和其它样本xj之间的欧氏距离dis(xi,xj);

S26、根据欧氏距离,对于 构造以样本xi为圆心,xi到对应的中心样本之间的距离 为半径的模糊球,其定义如下:

其中,p表示样本xi对应的决策类, 表示以样本xi为圆心, 为半径的模糊球所选的邻域集合;

S27、对于 再构造以样本xi对应的中心样本 为圆心,

为半径的模糊球,其定义如下:

其中,p表示样本xi对应的决策类, 表示以样本xi对应的中心样本 为圆心,为半径的模糊球所选的邻域集合;

S28、将两个模糊球进行融合,得出样本xi对应的模糊凸半球δA(xi),该凸半球是在模糊球 的基础上选取靠近样本xi对应的中心样本 一侧的样本点;

S29、根据模糊凸半球和欧氏距离,可得出精神分裂症由模糊凸半球得到的样本xi与xj的模糊相似关系Rch(xi,xj):S30、依据最大相关最小冗余最大交互策略,刻画精神分裂症数据的特征重要度,对特征进行排序;所述步骤S30包括如下步骤:S31、计算精神分裂症数据的每个决策类别对应的模糊决策,记为

S32、计算精神分裂症当前候选特征与模糊决策之间的相关性Rel,对于 约简子集 当前候选特征 具体表示如下:其中,|U|为论域的个数,[xi]CF表示样本xi在特征集CF上对应的模糊相似关系值,表示样本xi在模糊决策 上对应的模糊相似关系值;

S33、计算精神分裂症当前候选特征与约简特征之间的冗余性Rdd,对于 约简子集 ak∈Red,当前候选特征 表示样本xi在特征集ak上对应的模糊相似关系值,表示如下:

S34、计算精神分裂症当前候选特征、剩余候选特征和模糊决策之间的交互性Itrc,对于 约简子集 当前候选特征 aj∈CF,剩余候选特征[xi]RCF表示样本xi在特征集RCF上对应的模糊相似关系值,表示如下:

S35、计算精神分裂症中每个病理特征 计算对应的相关性Rel,选择具有最大相关性对应的特征ak,将特征ak加入特征排序集合Sort中,并在当前候选特征子集CF中进行删除;

S36、计算精神分裂症当前候选特征与约简特征之间的冗余性Rdd,再计算当前候选特征、剩余候选特征和模糊决策之间的交互性Itrc,并设计特征重要度度量得出每个候选特征的重要性;

S37、选择具有最大特征重要性对应的特征ak,将特征ak加入特征排序集合Sort中,并在当前候选特征子集CF中进行删除,直到Sort集合中包含所有特征;

S40、对不同的粒度表示形成的特征序列采用类内类间策略决定最终的特征序列,并得出精神分裂症最终约简特征集合;

所述步骤S40包括如下步骤:

S41、根据步骤S30得出精神分裂症数据由稀疏约束得出的特征排序Sort_sparse和由模糊凸半球得出的特征排序Sort_semicircle;

S42、根据步骤S24计算精神分裂症数据的每个决策对应的中心样本点 对于每个决策类,计算决策类中的样本到该决策类的中心样本之间的平均距离θj,其中,j表示决策类类别,j=1,2,…,m;

S43、计算精神分裂症数据样本之间的类内距离CW_dist,具体定义如下:S44、对精神分裂症的所有样本取中心样本点

S45、计算精神分裂症数据样本之间的类间距离CB_dist,即每个决策对应的中心样本点 到所有样本的中心样本 的平均距离,具体定义如下:S46、根据类内距离CW_dist和类间距离CB_dist,可得出精神分裂症数据的类内类间距离CWB,即类间距离与类内距离之比;

S47、判断当前候选特征是否存在于最终的特征排序Sort_final中,如果已经存在,则跳过该特征;如果判断的特征相同,则直接加入Sort_final,否则将目前的Sort_final与当前判断特征进行组合,分别为Current_sparse和Current_semicircle,计算Current_sparse和Current_semicircle所对应的类内类间值,将具有较大类内类间值对应的特征加入Sort_final中,直到Sort_final中包含了所有的特征;

S48、对于Sort_final中的每个精神分裂症病理特征都有对应的类内类间值,判断该值在k处发生连续多次下降,则在k处进行截断,形成最终的约简子集Red。

2.根据权利要求1所述的面向精神分裂症的双通道模糊信息粒与特征选择方法,其特征在于,所述步骤S10包括如下步骤:S11、读取精神分裂症数据集,确定其特征集和决策分类,所述决策信息系统S=,其中U={x1,…,xi,…,xN}表示精神分裂症数据的样本集,N表示精神分裂症的个数,xi表示第i个样本,xN表示第N个样本;C={a1,…,ai,…,an}表示精神分裂症数据特征的非空有限集,n表示精神分裂症数据中的特征个数,ai表示第i个特征,an表示第n个特征;D={d1,…,di,…,dm}表示精神分裂症数据决策特征的非空有限集,m表示精神分裂症数据中的决策类别个数,di表示第i个决策类别,dm表示第m个决策类别;V=∪a∈C∪DVa,Va是精神分裂症数据特征a的可能情况;f:U×(C∪D)→V是一个信息函数,它为每个精神分裂症数据赋予一个信息值,即S12、根据数据集中决策特征D的不同信息值个数,将所述精神分裂症数据集S划分为t个数据子集,且满足 其中Si表示第i个数据子集,Sj表示第j个数据子集,i≠j,i=1,2,…,t,j=1,2,…,t。