利索能及
我要发布
收藏
专利号: 2019112553041
申请人: 电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于RCNN的指纹奇异点检测方法,其特征在于,所述方法包括:

步骤1)在计算机读取原始指纹图像后构造数据集:获取大小为256*320含噪点的指纹原始灰度图像,首选进行人工图像增强、标注groundtruth,再将图像进行归一化处理,同时按照8:2的比例划分训练集和测试集;

步骤2)搭建用于图像增强的解编码卷积神经网络,由编码网络和解码网络两个模块组成,使用原始数据集进行训练图像增强网络,并将网络预测输出的256*320的指纹图片进行保存,作为3)的输入;

步骤3)将增强后的指纹图像按照网格分割为大小为若干41*41的区域,手动标注每个区域所属的类别,并用矩阵表示,作为groundtruth,再设置概率阈值,用于筛选分类后的结果,使用增强后的图像数据集训练Res-net分类器,针对每个区域的输出结果,保留高于概率阈值的区域,用于步骤4);;

步骤4)将步骤三中含奇异点的区域图像作为输入,将归一化后的指纹坐标作为输出,进行FCN的训练,该FCN本质上是对提出的感兴趣区域进行回归;

步骤5)提取步骤四中FCN的预测结果,与真实值进行比较,计算方法预测的准确性,以预测点与真实点之间的欧式距离作为依据,将距离低于阈值的点视为检测成功。

2.根据权利要求1,其特征在于:所述步骤1)一中人工图像增强指运用图像处理技术进行滤波、降噪等操作,标注groundtruth指手动标注出奇异点的位置,并且读取奇异点的坐标,将其保存为csv文件,图像归一化指将所有像素点的灰度值除以255,使其值在[0,1]范围内。

3.根据权利要求1,其特征在于:所述步骤2)中图像增强网络由编码器网络和解码器网络构成,编码器网络的结构为两个分别由两层相同的卷积层(卷积核为3*3,通道数依次为

16和64,步长为1)和一层最大池化层(窗口大小为2*2)模块,编码器网络由两个含一层上采样层(窗口大小为2*2)和相同两层卷积层(卷积核为3*3,通道数依次为64和16,步长为1)的网络模块构成,最后再通过一层卷积核为1*1的卷积层,训练过程中使用均方误差作为损失函数,使用随机梯度下降算法进行参数优化。

4.根据权利要求1,其特征在于:所述步骤(3)中标注各区域类别的矩阵如下所示:

其中C为类别矩阵,ci∈{0,1},i=1,2,3,c1表示该区域内是否含有奇异点,c2表示该区域内是否含有核心点,c3表示该区域内是否含有三角点,概率阈值依据具体数据集而定,一般略小于预测概率的最大值。

5.根据权利要求1,其特征在于:所述步骤(3)中的Res-net具体结构为:一个卷积核为

5*5、通道数为16的卷积层,连接一个窗口大小为2*2、通道数为16的下采样层,然后连接卷积核为5*5、通道数为32的卷积层并且延申出至下一卷积层的残差网络,接着是窗口大小为

2*2、通道数为64的下采样层,最后是一个卷积核为5*5、通道数为64的卷积层以及全连接层,该网络的训练参数设置同步骤二中的网络。

6.根据权利要求1,其特征在于:所述步骤(4)中训练集为步骤三中高于概率阈值的41*

41像素的区域灰度图片,我们需要通过原始图像标注的坐标来计算该区域内奇异点坐标,并将其归一化,具体步骤如下:其中xi为原始坐标,xi′为区域灰度图片内奇异点的坐标, 为归一化后的坐标值,n为数据集中指纹图片的。

7.根据权利要求1,其特征在于:所述步骤(4)中的FCN由四个相似的模块组成,每个模块由两层卷积层(卷积核为3*3,通道数依次为16、64、128和256)和一层最大池化层(窗口大小为2*2)组成,全连接层的层数为2,结点个数分别为256和2,在该网络中,使用随机梯度下降进行回归,网络通过将均方误差反向传播来学习。

8.根据权利要求1,其特征在于:所述步骤5)中所用的欧式距离如下所示:

其中px,py,gx,gy分别表示预测点的横纵坐标以及真实奇异点的横纵坐标,threshold为阈值。

9.根据权利要求1,其特征在于:所述步骤(5)中其阈值依据图片大小而定,一般为图像规模的十分之一左右,根据图片大小我们取阈值为20个像素点。