利索能及
我要发布
收藏
专利号: 2022105212932
申请人: 三峡大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.目标定位与语义分割相结合的超广角眼底图像视盘提取方法,其特征在于包括以下步骤:步骤1:建立YOLOv4模型,进行视盘区域的粗定位;

步骤2:根据视盘区域的粗定位结果,提取包含视盘区域,除去眼周区域;

2

步骤3:通过活动轮廓模型Snake模型交互式分割视盘区域,构建U‑Net模型训练所需的具有视盘标签的数据集;

2

步骤4:使用U‑Net模型进行视盘区域提取。

2.根据权利要求1所述目标定位与语义分割相结合的超广角眼底图像视盘提取方法,其特征在于:所述步骤2中,根据YOLOv4模型视盘定位结果,提取包含视盘的感兴趣区域,除去干扰视盘区域提取的眼周区域,将视盘中心置于截取图像的偏左或者偏右的位置,截取两个256×256大小感兴趣区域,并覆盖上了掩模。

3.根据权利要求1所述目标定位与语义分割相结合的超广角眼底图像视盘提取方法,其特征在于:所述步骤3包括以下步骤:首先,对超广角眼底图像进行灰度归一化和高斯滤波,除去噪声;然后手动选取初始轮廓曲线的坐标点,利用插值法得到封闭轮廓曲线;接着计算能量函数E,利用能量函数E得到其梯度F以及五对角带状矩阵A,进而更新曲线上各点位置;最后,填充封闭曲线内的空白区域,得到视盘标签;

如公式(1)‑(6)所示:

Esnake=∫E(v(s))ds=Eint(v(s))+Eext(v(s)) (1);

其中:v(s)代表曲线函数,Esnake代表Snake曲线能量,Eint代表内部能量,Eext代表外部能量;

2 2

Eint(v(s))=∫(|v′(s)|+|v″(s)|)ds (2);

其中:v′(s)为曲线函数一阶导数,v″(s)为曲线函数二阶导数;

Eext(v(s))=Eimg(v(s))+Econstaint(v(s)) (3);

其中:Eimg(v(s))、Econstaint(v(s))分别表示图像能量和约束力能量;

其中:I为输入图像,Ix与Iy分别代表图像对x轴与y轴的偏导,x与y为坐标值;

表示图像倒数,Ixx、Ixy、Iyy分别表示:图像在x轴上二阶偏导数,在x与y轴上各一次求导的二阶偏导数、在y轴上的二阶偏导数;

其中:xss与xssss分别代表v(s)对x轴的一阶与二阶偏导,yss与yssss分别代表v(s)对y轴的一阶与二阶偏导;α、β为权重;

其中:fx与fy分别代表Esnake对x轴与y轴的偏导,t代表迭代次数;

xt、yt为本次迭代曲线各点的坐标;

xt‑1、yt‑1为上次迭代曲线各点的坐标,A为五对角带状矩阵,γ为权重系数。

4.根据权利要求1所述目标定位与语义分割相结合的超广角眼底图像视盘提取方法,2

其特征在于:所述步骤3中,在U ‑Net模型训练前,通过对比度受限直方图均衡化技术CLAHE,增强视盘与背景的对比度,以提升模型训练效果。

5.根据权利要求1所述目标定位与语义分割相结合的超广角眼底图像视盘提取方法,其特征在于:所述步骤4包括以下步骤:2

S4.1:将增强图片输入U‑Net模型,提取视盘区域;

2

S4.2:对U‑Net模型输出结果进行二值化,得到二值视盘区域图像。