利索能及
我要发布
收藏
专利号: 2020103645634
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于多任务进化算法的医学图像聚类方法,其特征在于,包括以下步骤:S1、提取医学图像的ROI特征描述数据;

S2、读入提取医学图像的ROI特征描述数据,运用NMP聚类规则,通过对多个聚类内部指标进行优化,在多任务框架下得到多个聚类结果;

S3、利用医生的专家知识从中选出一个最优的结果;

所述步骤S2的具体过程如下:

S2‑1、读入提取医学图像的ROI特征描述数据;

S2‑2、初始化种群和最大迭代次数n,当前迭代次数k=0;

S2‑3、结合NMP聚类规则执行聚类并用聚类指标进行评估;

S2‑4、计算每个个体的技能因子τ;

S2‑5、生成子代;从种群中随机选取两个个体a和b作为父代,产生一个大于0小于1的随机数rand,如果rand小于算法参数rmp或者两个个体的技能因子τ相等,则执行模拟二进制交叉,否则分别对这两个个体执行变异;重复杂交或变异的步骤直至得到子代个数和种群个体数相等时停止,并进入步骤S2‑6;

S2‑6、计算生成的子代在各个聚类指标优化任务下的适应值;

S2‑7、将父代和子代合并组成新的种群,聚类后根据适应值重新计算更新其中所有个体的技能因子τ和标量适应值φ;

S2‑8、根据标量适应值φ对种群内个体排序,之后从优到劣依次选取个体进入下一代种群,φ更大的个体优先被选入下一代种群;k=k+1;

S2‑9、若k

S2‑10、找出技能因子τ等于1的个体,记录作为当前各个任务最优的个体;

步骤S2‑3中,所述聚类指标包括CH指标、Dunn指标、SIL指标,分别对应一个优化任务;

各指标具体如下:

CH指标:

上式中, 表示类别间离差矩阵SB的迹,m表示整个数据集的平均值向量,K为聚类类别个数;

Dunn指标:

上式中,D(Ci,Cj)代表不同类别间的距离是两个最靠近的数据点Ci和Cj之间的距离,公式表达如下: δ(Ci)为这个类别的两个最远距离点间距离:SIL指标:

上式中,sj=(bj‑aj)/max(aj,bj)代表数据点xj的轮廓宽度;数据点xj到它所属类别的其他数据点的平均距离aj和到其他类别数据点的最小距离bj的计算公式如下:

2.根据权利要求1所述的基于多任务进化算法的医学图像聚类方法,其特征在于,所述步骤S1提取的医学图像的ROI特征描述数据包括相对灰度s1、相对面积s2、相对质心坐标s3、似圆性s4、角度s5以及对称性s6。

3.根据权利要求2所述的基于多任务进化算法的医学图像聚类方法,其特征在于,所述步骤S1提取医学图像的ROI特征描述数据的具体过程如下:S1‑1、读入医学图像;

S1‑2、扫描医学图像,得到图像的像素数、长、宽和灰度最大值;

S1‑3、检测医学图像的对称性s6;

S1‑4、根据灰度范围提取医学图像的ROI区域;

S1‑5、对步骤S1‑4得到的ROI区域提取灰度均值、像素个数、最长轴、最短轴、质心坐标以及角度;

S1‑6、计算ROI区域的特征描述数据。

4.根据权利要求3所述的基于多任务进化算法的医学图像聚类方法,其特征在于,所述步骤S1‑3检测医学图像对称性s6的过程为:将医学图像对折做差,并用灰度阈值做二值化处理,若剩余的像素点少于设定值,则判定医学图像对称,反之则不对称;

所述步骤S1‑6计算ROI区域的特征描述数据的具体过程如下:相对灰度s1: 其中ROI.gray为ROI区域的平均灰度,IMAGE.gray为整个图像的平均灰度;

相对面积s2:s2=ROI.area/IMAGE.area,ROI.area为ROI区域的像素个数,IMAGE.area为整个图像的像素个数;

相对质心坐标s3:s3=(ROI.x/IMAGE.length,ROI.y/IMAGE.height),ROI.x为ROI质心的横坐标,IMAGE.length为原图像的长度,ROI.y为ROI质心的纵坐标,IMAGE.height为原图像的高度;

2

似圆性s4:s4=4×π×ROI.area/ROI.perimeter ,ROI.area为ROI区域的像素个数,ROI.perimeter为ROI区域周边像素的个数;

角度s5:s5=(Orientation+90)/180,Orientation为ROI的长轴到X轴的夹角。

5.根据权利要求1所述的基于多任务进化算法的医学图像聚类方法,其特征在于,所述步骤S2‑2中,种群通过以下编码完成初始化:设定聚类类别数的最大值Kmax,种群的个体编码为Kmax+Kmax*d维的向量d为数据维度数,mij为簇中心的坐标向量,Tij为得到类别质心点的激活阈值,j=1,...,Kmax;

激活得到质心点的定义具体如下:

若Tij大于0.5,则对应簇的质心点mij被激活,否则不被激活;若Tij大于1或为负数则重置为1或0,如果得到的质心数小于设置的最小类别数则随机选取几个激活阈值激活以满足最小类别数的要求。

6.根据权利要求1所述的基于多任务进化算法的医学图像聚类方法,其特征在于,步骤S2‑3中,所述NMP聚类规则具体如下:给定一个个数为N数据集,数据表示为X=(x1,...,xN),K个簇的质心为C={C1,...,CK},D表示距离,那么,在NMP规则中样本点xi=(i=0,...,N)和某一聚类类别Ch(h=1,...,K)的距离定义如下:D(xi,Ch)=min{D(xi,xj),D(xi,mh)|xj∈Ch}即样本到簇类别的距离是样本到簇各点中距离最小的那个距离;

每个样本被分配到最近的簇中,所有被分配到同一个簇的样本组成了一个候选样本集,这个簇称为这些样本的一个未确定簇;然后,对每一个簇,从候选样本集中选一个最近的样本,所有簇的这种最近样本点合并称为最近样本集;最后,在最近样本集中找到一个样本,这个样本离它所在的未确定簇距离是最近样本集中最小的,便将该样本分配到它的未确定簇中;不断重复上述步骤直到所有样本被分配完毕。

7.根据权利要求1所述的基于多任务进化算法的医学图像聚类方法,其特征在于,步骤S2‑5中,所述模拟二进制交叉的操作如下:设有两个父代xa=[xa(1),...,xa(d)]和xb=[xb(1),...,xb(d)],d为数据的维度,首先计算分布因子c(j):其中,β为一个大于0的系统参数,r在各个维度上都是大于0小于1的随机数;

得到子代为:

xe(j)=[(1+c(j))xa(j)+(1‑c(j))xb(j)]/2xf(j)=[(1+c(j))xb(j)+(1‑c(j))xa(j)]/2。