利索能及
我要发布
收藏
专利号: 202010171801X
申请人: 甄鑫
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于随机投影的肾小肿块分类方法,其特征在于,所述方法包括:S10,获取N个描述肾小肿块的目标对象数据;所述目标对象数据包括相应肾小肿块的CT平扫图像、mask图像和标签数据;所述标签数据表征相应肾小肿块为良性或恶性;

S20,根据各个所述mask图像对各个所述CT平扫图像进行靶区勾画,得到各个所述CT平扫图像的感兴趣区域,对各个所述感兴趣区域进行放射组学特性数据提取,得到N个放射组学特性数据;

S30,将所述N个放射组学特性数据通过L个随机投影矩阵投影,得到L套投影特性数据;

S40,对L套投影特性数据分别进行多个分类器训练,得到各个分类器的预测矩阵和训练后的各个分类器,根据各个分类器的预测矩阵设置各个分类器的权重;

S50,采用训练后的各个分类器根据相应的权重对待分类数据进行融合处理,以确定所述对待分类数据的类别;

S40中,所述根据各个分类器的预测矩阵设置各个分类器的权重包括:根据各个分类器的预测矩阵计算良性肾小肿块对应的第一平均预测矩阵以及恶性肾小肿块对应的第二平均预测矩阵;

计算各个分类器的预测矩阵分别至第一平均预测矩阵和第二平均预测矩阵的欧式距离;

根据各个分类器的预测矩阵分别至第一平均预测矩阵和第二平均预测矩阵的欧式距离确定N个目标对象数据在各个分类器上的预测标签;

根据N个目标对象数据在各个分类器上的预测标签和N个目标对象数据分别包括的标签数据计算各个分类器的预测准确度参数,根据各个分类器的预测准确度参数确定各个分类器的权重。

2.根据权利要求1所述的方法,其特征在于,所述第一平均预测矩阵或者第二平均预测矩阵的确定过程包括:

式中, 表示第g平均预测矩阵,g的取值为1或者2, 表示第i个目标对象数据,N表示目标对象数据的个数, 表示第m个分类器相对于第i个目标对象数据的预测矩阵,表示 的标签数据,yg表示类别标签g;

所述欧式距离的计算过程包括:

式中, 表示第m个分类器相对于第i个目标对象数据至第g平均预测矩阵的欧式距离,L表示随机投影矩阵的个数,G表示类别数;

一个目标对象数据在一个分类器上的预测标签的确定过程包括:式中, 表示在该分类器进行分类的目标对象数据,ys表示该分类器针对该目标对象数据预测得到的标签数据, 表示 的预测标签,符号 表示该符号后面的等式成立时,得到该符号前面的类别归属关系;

所述根据各个分类器的预测准确度参数确定各个分类器的权重的过程包括:min

式中,ωm表示第m个分类器的权重,accm表示第m个分类器的预测准确度参数,acc 表max

示各个预测准确度参数中的最小值,acc 表示各个预测准确度参数中的最大值。

3.根据权利要求2所述的方法,其特征在于,所述采用训练后的各个分类器根据相应的权重对待分类数据进行融合处理,以确定所述对待分类数据的类别包括:将各个预测矩阵分别至第一平均预测矩阵和第二平均预测矩阵的欧氏距离按行拼接得到预测距离矩阵,采用各个分类器的权重分别对预测距离矩阵中相应分类器对应的欧式距离加权,得到第一加权距离矩阵,对第一加权距离矩阵按目标对象数据的标签数据分组取平均,得到第一平均距离矩阵和第二平均距离矩阵;

将待分类数据通过L个随机投影矩阵投影,得到L套分类投影数据,分别将L套分类投影数据输入训练后的各个分类器进行预测,得到各个分类器针对待分类数据预测得到的分类预测矩阵;

计算各个分类预测矩阵分别至第一平均预测矩阵和第二平均预测矩阵的欧式距离;

将各个分类预测矩阵分别至第一平均预测矩阵和第二平均预测矩阵的欧氏距离按行拼接得到分类距离矩阵,采用各个分类器的权重分别对分类距离矩阵中相应分类器对应的欧式距离加权,得到第二加权距离矩阵;

将第二加权距离矩阵、第一平均距离矩阵和第二平均距离矩阵代入分类公式确定待分类数据的类别;所述分类公式包括:式中, 表示待分类数据, 表示第二加权距离矩阵, 表示第g平均距离矩阵,G表示待分类数据的类别数,ys表示分类器针对待分类数据预测得到的标签数据,表示 的预测标签。

4.根据权利要求3所述的方法,其特征在于,所述第一平均距离矩阵或第二平均距离矩阵的确定公式包括:

式中, 表示第一加权距离矩阵。

5.根据权利要求1所述的方法,其特征在于,所述将所述N个放射组学特性数据通过L个随机投影矩阵投影,得到L套投影特性数据包括:式中, 表示第l套投影特性数据,D表示N个放射组学特性数据,Pl表示第l个随机投影矩阵投影,q表示随机投影矩阵投影对应的投影域的数据维度。

6.根据权利要求5所述的方法,其特征在于,所述随机投影矩阵的确定方式包括:式中,P表示随机投影矩阵,rij从设定集合的取值中随机取值,下标i表示P的行序号,下标j表示P的列序号;

和/或,数据维度q的确定方式包括:当p>q0时,q=q0;当p≤q0时,q=p/2;其中,q0=[22

×ln(n)/ε],ε=0.25,p表示投影前放射组学特性数据的维度。

7.根据权利要求1至6任一项所述的方法,其特征在于,所述对L套投影特性数据分别进行多个分类器训练,得到各个分类器的预测矩阵包括:采用Python编程语言环境下的scikit‑learn机器学习软件包构建各个分类器模型,将L套投影特性数据和相应的标签数据分别输入所述各个分类器模型,针对各个分类器模型分别调用fit函数进行训练,得到各个分类器的预测矩阵。

8.根据权利要求1至6任一项所述的方法,其特征在于,所述分类器包括:贝叶斯分类器、逻辑回归分类器、二次判别分析分类器、K近邻分类器、决策树分类器、随机森林分类器和XGBoost分类器。

9.根据权利要求1至6任一项所述的方法,其特征在于,所述CT平扫图像为非对比增强CT扫描图像;

和/或,各个放射组学特性数据均包括多个放射组学特征;所述放射组学特征包括形状特征、一阶统计特征和纹理特征。