1.基于粗糙集正域与信息熵综合的医学检验指标约简方法,用于针对某疾病的所有医学检验指标进行约简,其特征在于,包括如下步骤:步骤1,获取医学检验指标数据集,所述医学检验指标数据集中的每个样本均包括患者、针对某疾病该患者的所有检验指标数据以及针对某疾病该患者的诊断结论;将所述医学检验指标数据集转换为模糊信息决策系统(U,A,D),其中,U={x1,x2,…,xN}表示所有患者的集合,xi表示第i个患者,i=1,…,N,N为所有患者的数量,A={a1,a2,…,aM}表示针对某疾病的所有医学检验指标集合,am表示第m个指标,m=1,…,M,M为所有医学检验指标的数量,U/D={D1,D2,…,DR}表示将U划分到不相交的诊断结论类别中,Dr表示第r个诊断结论类别,r=1,…,R,R为诊断结论类别的数量;
步骤2,通过粗糙集正域方法计算所有医学检验指标集合A的正域,根据集合A的正域计算加权系数α以及诊断结论类别集合D对A的依赖度γA(D);具体过程如下:步骤2.1,在模糊信息决策系统(U,A,D)中,对于每个医学检验指标am,计算任意两个患者之间的距离,得到每个医学检验指标对应的距离矩阵其中,对于医学检验指标am,任意两个患者xi,xj之间的距离计算公式如下:其中,am(xi)、am(xj)分别表示患者xi,xj对医学检验指标am的值;
步骤2.2,根据所有医学检验指标各自对应的距离矩阵,得到集合A的距离矩阵dA;dA中的元素表示为:步骤2.3,根据距离矩阵dA计算每个患者关于集合A的下近似,公式如下:步骤2.4,基于步骤2.3,计算集合A的正域POSA(D),公式如下:步骤2.5,根据集合A的正域POSA(D)计算加权系数α,公式如下:其中,|U|表示所有患者的数量即N;
步骤2.6,根据集合A的正域POSA(D)计算诊断结论类别集合D对A的依赖度γA(D),公式如下:步骤3,通过聚类方法将模糊信息决策系统转换为确定性的信息决策系统(U,A′,D),在′确定性信息决策系统中计算D的信息熵H(D)以及全属性A′下的条件信息熵H(D|A);
步骤4,设定约简集为B,并初始化约简集B为空集;
步骤5,对于集合A中未被选择到B中的每个指标,将每个指标与当前约简集B相并,得到每个指标对应的并集,计算各指标对应的并集基于粗糙集正域的重要度和基于信息熵的重要度,进而计算各指标对应的并集的综合重要度;
* *
步骤6,将最大综合重要度所对应的指标a 加入到当前约简集B中,得到集合B∪{a},作为新的约简集B;
步骤7,根据步骤2相同的方法计算诊断结论类别集合D对步骤6得到的新约简集B的依赖度γB(D),以及根据步骤3相同的方法计算步骤6得到的新约简集B下的条件熵H(D|B);
′
步骤8,判断是否满足γB(D)=γA(D)且H(D|B)=H(D|A),若满足,则将步骤6得到的新约简集B作为最终的指标约简集合输出;否则返回步骤5,在集合A未被选择到B的指标中继续选择综合重要度最大所对应的指标加入步骤6得到的新约简集B中,再一次生成新的约简′集B,直至满足γB(D)=γA(D)且H(D|B)=H(D|A)。
2.根据权利要求1所述的基于粗糙集正域与信息熵综合的医学检验指标约简方法,其特征在于,所述步骤3的具体过程如下:步骤3.1,对于每个医学检验指标am,利用模糊聚类算法将所有患者聚成k个聚类,根据最大隶属度原则,将模糊聚类转化为确定性分类,每个患者归属到最大隶属度对应的分类中,生成确定性的信息决策系统(U,A′,D);
步骤3.2,在(U,A′,D)中计算D的信息熵H(D):其中,P(Dr)表示患者被划分到第r个诊断结论类别Dr的概率,|Dr|表示被划分到第r个诊断结论类别的患者数量;
步骤3.3,计算全属性A′诱导的所有患者的联合划分:U/A′,进而计算全属性A′下的条′件信息熵H(D|A)。
3.根据权利要求2所述的基于粗糙集正域与信息熵综合的医学检验指标约简方法,其特征在于,所述步骤5的具体过程如下:步骤5.1,对于每一个未选指标am∈A\B,将am与前一次迭代得到的约简集B相并,得到B∪{am},第一次迭代时,计算各B∪{am}的正域
其中, 表示每个患者关于集合B∪{am}的下近似;
计算各B∪{am}基于正域的依赖度
步骤5.2,计算各B∪{am}基于粗糙集正域的重要度:
其中,γB(D)为当前约简集B的依赖度,第一次迭代时, γB(D)=0;
步骤5.3,在(U,A′,D)中计算各B∪{am}诱导的划分U/(B∪{am})={X1,…,XT},第一次迭代时的划分为利用模糊聚类算法得到的聚类;
步骤5.4,计算各B∪{am}的条件熵H(D|B∪{am}):其中,|Xt|表示集合Xt中患者人数,|Dr∩Xt|表示集合Xt中诊断为Dr的患者人数,T表示在条件集合B∪{am}下将患者划分的类数,|U|表示所有患者的数量即N;
步骤5.5,计算各B∪{am}基于信息熵的重要度SGF(am,B,D):SGF(am,B,D)=H(D|B)‑H(D|B∪{am})其中,H(D|B)为前一次迭代得到的约简集B的条件熵,第一次迭代时,H(D|B)=H(D);
步骤5.6,计算各B∪{am}的综合重要度CS(am,B,D):
4.一种计算机设备,包括存储器、处理器,以及存储在所述存储器中并能够在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述的基于粗糙集正域与信息熵综合的医学检验指标约简方法的步骤。
5.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的基于粗糙集正域与信息熵综合的医学检验指标约简方法的步骤。