1.一种基于二值化图像分类网络的图像分类方法,其特征在于,包括以下步骤:S1:采集原始图像,并对原始图像进行初始化;
S2:根据初始化后的原始图像,搭建图像分类网络;
S3:利用图像分类网络的softmax分类器进行图像分类;
所述步骤S1包括以下子步骤:
S11:采集尺寸为224*224*3的原始图像,并在原始图像的四周各添加宽度为3的0元素,得到尺寸为230*230*3的第一输出图像;
S12:利用尺寸为7*7且步长为1的卷积核对第一输出图像进行卷积操作,得到尺寸为
224*224*64的第二输出图像,并对第二输出图像进行批量归一化,得到尺寸为224*224*64的第三输出图像;
S13:利用非线性激活函数H(x)对第三输出图像进行激活,并对激活后的第三输出图像进行最大池化,得到尺寸为112*112*64的第四输出图像;
S14:利用符号函数S(x')对第四输出图像进行二值化,得到尺寸为112*112*64的第五输出图像,完成原始图像初始化;
所述步骤S2包括以下子步骤:
S21:在第五输出图像的四周各添加宽度为1的0元素,得到尺寸为114*114*64的第六输出图像;
S22:利用尺寸为3*3且步长为1的二值化卷积核对第六输出图像进行卷积操作,得到尺寸为112*112*128的第七输出图像;
S23:利用非线性激活函数H(x)对第七输出图像进行激活,并对激活后的第七输出图像进行最大池化,得到尺寸为56*56*128的第八输出图像;
S23:在第八输出图像的四周各添加宽度为1的0元素,得到尺寸为58*58*128的第九输出图像;
S24:利用尺寸为3*3且步长为1的二值化卷积核对第九输出图像进行卷积操作,得到尺寸为56*56*256的第十输出图像;
S25:利用非线性激活函数H(x)对第十输出图像进行激活,并对激活后的第十输出图像进行最大池化,得到尺寸为28*28*256的第十一输出图像;
S26:在第十一输出图像的四周各添加宽度为1的0元素,得到尺寸为30*30*256的第十二输出图像;
S27:利用尺寸为3*3且步长为1的二值化卷积核对第十二输出图像进行卷积操作,得到尺寸为28*28*512的第十三输出图像;
S28:利用非线性激活函数H(x)对第十三输出图像进行激活,并对激活后的第十三输出图像进行最大池化,得到尺寸为14*14*512的第十四输出图像;
S29:在第十四输出图像的四周各添加宽度为1的0元素,得到尺寸为16*16*512的第十五输出图像;
S210:利用尺寸为3*3且步长为1的二值化卷积核对第十五输出图像进行卷积操作,得到尺寸为14*14*512的第十六输出图像;
S211:利用非线性激活函数H(x)对第十六输出图像进行激活,并对激活后的第十六输出图像进行最大池化,得到尺寸为7*7*512的第十七输出图像;
S212:在第十七输出图像的四周各添加宽度为1的0元素,得到尺寸为9*9*512的第十八输出图像;
S213:利用尺寸为3*3且步长为1的二值化卷积核对第十八输出图像进行卷积操作,得到尺寸为7*7*512的第十九输出图像;
S214:利用非线性激活函数H(x)对第十九输出图像进行激活,并对激活后的第十九输出图像进行拉伸,得到尺寸为1*25088的第二十输出图像;
S215:将第二十输出图像输入至两层神经元为4096的全连接层,完成图像分类网络搭建;
所述步骤S2中,对尺寸为3*3的卷积核进行二值化包括以下子步骤:A21:利用尺寸为3*3*Cin*Cout的第一二值化卷积核Bi1、第二二值化卷积核Bi2、第三二值化卷积核Bi3和第四二值化卷积核Bi4对尺寸为3*3的卷积核分别进行线性近似,其中,Cin表示输入通道数,Cout表示输出通道数;
A22:对线性近似后的卷积核矩阵中的各个元素进行归一化处理,得到归一化处理后的卷积核;
A23:设定第一二值化卷积核Bi1、第二二值化卷积核Bi2、第三二值化卷积核Bi3和第四二值化卷积核Bi4对应的激活阈值,分别为bi1、bi2、bi3和bi4;
A24:在第一二值化卷积核Bi1、第二二值化卷积核Bi2、第三二值化卷积核Bi3和第四二值化卷积核Bi4中,分别将归一化处理后的卷积核矩阵中小于激活阈值bi1、bi2、bi3和bi4的参数确定为0,大于激活阈值bi1、bi2、bi3和bi4的参数确定为1,并随机初始化第一二值化卷积核Bi1、第二二值化卷积核Bi2、第三二值化卷积核Bi3和第四二值化卷积核Bi4的权重,完成尺寸为3*3的卷积核的二值化。
2.根据权利要求1所述的基于二值化图像分类网络的图像分类方法,其特征在于,所述步骤S14中,符号函数S(x′)的表达式为:其中,x表示符号函数的输入图像,α表示第一待学习参数。
3.根据权利要求1所述的基于二值化图像分类网络的图像分类方法,其特征在于,所述步骤S13、步骤S23、步骤S25、步骤S28、步骤S211和步骤S214中,进行最大池化的池化池大小为2*2,步长为2*2。
4.根据权利要求1所述的基于二值化图像分类网络的图像分类方法,其特征在于,所述步骤S13、步骤S23、步骤S25、步骤S28和步骤S211中,非线性激活函数H(x)的表达式为:其中,x表示非线性激活函数的输入图像,β表示第二待学习参数,γ表示第三待学习参数,τ表示第四待学习参数。
5.根据权利要求1所述的基于二值化图像分类网络的图像分类方法,其特征在于,所述步骤A21中,进行线性近似的计算公式为:Wi≈αi1*Bi1+αi2*Bi2+αi3*Bi3+αi4*Bi4其中,Wi表示线性近似后的卷积核,αi1表示第一二值化卷积核Bi1的权重,αi2表示第二二值化卷积核Bi2的权重,αi3表示第三二值化卷积核Bi3的权重,αi4表示第四二值化卷积核Bi4的权重;
所述步骤A22中,对线性近似后的卷积核矩阵中的各个元素aij进行归一化处理的公式为:
其中,a′ij表示归一化后的各个元素,min表示元素aij中的最小值,max表示元素aij中的最大值。