利索能及
我要发布
收藏
专利号: 2017114291650
申请人: 河海大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-07
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,包括如下步骤:步骤1,获取人眼训练图像,包括RGB彩色图像和近红外图像,分别对RGB彩色图像和近红外图像进行归一化处理后,融合成四通道图像,将四通道图像作为卷积神经网络的输入进行训练,且输入图像的大小为28*28像素;

步骤2,卷积神经网络依次包括第一卷积层、第一池化层、第二卷积层、第二池化层、全连接层;第一卷积层采用5个5*5的感受器对输入图像进行卷积,步长为1,得到20个24*24的特征图,将20个24*24的特征图经过Relu激活函数处理后,得到20个具有非线性因素的特征图;

步骤3,第一池化层采用最大池化方式对步骤2得到的20个具有非线性因素的特征图进行池化,其中,过滤器的大小为2*2,步长为2,得到20个12*12的特征图;

步骤4,第二卷积层采用20个5*5的感受器对步骤3得到的20个12*12的特征图进行卷积,得到20个8*8的特征图,将20个8*8的特征图经过Relu激活函数处理后,得到20个具有非线性因素的特征图;

步骤5,第二池化层采用最大池化方式对步骤4得到的20个具有非线性因素的特征图进行池化,其中,过滤器的大小为2*2,步长为2,得到20个4*4的特征图;

步骤6,全连接层对步骤5得到的20个4*4的特征图进行分类,得到训练好的卷积神经网络;

步骤7,采用Kinect相机获取人脸测试图像,包括RGB彩色图像和近红外图像,对人脸测试图像进行归一化处理后,融合成四通道图像,将四通道图像输入训练好的卷积神经网络中识别,得到识别结果。

2.根据权利要求1所述基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,所述Relu激活函数的具体形式如下:其中,Relu(x)表示激活函数的输出,x表示激活函数的输入。

3.根据权利要求1所述基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,步骤2所述第一卷积层的实现过程为:采用可训练的感受器对输入图像进行卷积,然后加一个偏置,即得到该卷积层的卷积结果。

4.根据权利要求1所述基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,步骤3所述第一池化层的实现过程为:采用最大池化方式进行池化,其中,过滤器为正方形,过滤器的边长与步长保持一致,再通过标量加权,增加偏置,产生缩小四倍的特征图,从而达到降维的目的。

5.根据权利要求1所述基于卷积神经网络的多通道人眼闭合识别方法,其特征在于,步骤1所述获取人眼训练图像所采用的相机为Kinect相机。