利索能及
我要发布
收藏
专利号: 2021104052768
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于宫颈癌数据分类的粗糙图卷积方法,其特征在于,包括以下步骤:步骤1、从UCI数据库中选取合适的采集宫颈癌数据,将所述宫颈癌数据转换为一个四元组决策信息系统S=<U,C∪D,V,f>,其中U={x1,x2,…,xL}表示宫颈癌数据中宫颈癌患者对象集合,L表示宫颈癌患者的个数,C={a1,a2,…,an}表示宫颈癌患者细胞病理特征的非空有限集合,n表示宫颈癌患者细胞病理特征的个数,D={d1,d2,…,dm}表示宫颈癌患者决策属性的非空有限集合,m表示宫颈癌患者决策属性的个数,且V=∪a∈C∪DVa,Va是宫颈癌患者细胞病理特征a的可能情况,f:U×C∪D→V是一个信息函数,它为每个宫颈癌患者细胞病理特征a赋予一个信息值,x∈U,f(x,a)∈Va;

步骤2、对由宫颈癌数据转换成的四元组决策信息系统S=<U,C∪D,V,f>采用启发式搜索计算约简,可以删除冗余属性,得到宫颈癌数据的病理特征约简子集R;

步骤3、构建一个稀疏图G={Z,E},Z代表图中的节点,E代表图的边,处理好的宫颈癌数据中的每个样本作为图的各个节点,图的边表示节点和节点之间的关联性,即表示宫颈癌例是否有相同的病理特征,可得到N*N的拓扑图的邻接矩阵A,N是图中由处理后的宫颈癌数据组成的节点的个数,N*F是图的特征矩阵X,F是每个由处理后的宫颈癌数据组成的节点的输入特征个数,定义节点病理特征的个数就是输入特征的个数;

步骤4、采用图卷积神经网络模型GCN,把由约简后的宫颈癌数据转换成的拓扑图作为GCN的输入,用半监督的方法对由宫颈癌数据作为节点的拓扑图进行特征提取,将得到的结果可视化;

步骤5、利用训练好的基于粗糙集的图卷积神经网络模型对宫颈癌数据进行特征提取,获得宫颈癌数据的分类;

所述步骤2的具体步骤如下:

步骤2.1、初始化宫颈癌数据的约简集R,把最初的宫颈癌数据约简集定义为空集,即 步骤2.2、计算宫颈癌细胞病理特征集中每个病理特征ak∈C-R(k=1,2,…,n)相对于病理特征约简子集R的重要度,按照重要度从大到小的顺序得到候选病理特征集{a1′,a2′,…,an′};

步骤2.3、将候选病理特征集中最大重要度对应的病理特征ak′加入病理特征约简子集R,并将病理特征ak′从候选病理特征集中移除,直到候选病理特征集中的剩余属性的重要度为0时结束,输出病理特征约简子集R;

所述步骤4的具体步骤如下:

步骤4.1、半监督GCN的框架是由输入层、隐藏层、输出层组成,它的输入是由约简后的宫颈癌数据得到的拓扑图节点I1,I2,…,Iw组成,w代表节点的个数,每个节点都包含C维特征,其中有的节点为带标签节点,剩下的节点为不带标签的节点,设定有三个及以上病理特征的宫颈癌细胞组成的节点为带标签节点,要共同进行训练,经过卷积层的处理,最终输出F个分类对应的预测概率P1,P2,…,Pw;

步骤4.2、构建一个两层的GCN,输入通过约简后的宫颈癌数据得到的拓扑图的A和X,对节点都是由宫颈癌数据构成的邻接矩阵A进行预处理:D为度矩阵;

步骤4.3、用于宫颈癌数据分类的图卷积神经网络模型的快速卷积公式如下:

其中W就是参数矩阵,σ是激活函数,ChebNet经过重新规范化:I是单位矩阵,I+D-1/2AD-1/2是范围在[0,2]之间的特征值;

步骤4.4、输入的A和X先进行第一层卷积,卷积后通过Relu函数进行非线性转换:

其中W(0)是输入层到隐藏层的权重矩阵;

步骤4.5、将经过Relu非线性转换的结果输入给第二层卷积,采用一阶近似ChebNet方法,再经过softmax转换后输出,公式如下: 其中W(1)是隐藏层到输出层的权重矩阵;图卷积神经网络的权重W(0),W(1)是通过梯度下降来进行训练的,softmax用于处理后的宫颈癌数据的分类过程中,它将多个神经元的输出映射到(0,1)区间内;

步骤4.6、使用该GCN进行特征提取后,得到由各个约简后的宫颈癌数据组成的节点的嵌入,经过可视化就得到各个由约简后的宫颈癌数据组成的节点所属的类别,即可得到宫颈癌数据的分类结果。