1.一种基于卷积神经网络和编码的手写数字识别方法,其特征在于,步骤如下:
S1:获取手写体数字图像的训练数据,并对每张手写体数字图像进行轮廓信息提取,然后将每张手写体数字图像的原图和轮廓图进行通道相加,再经过归一化后得到双通道手写体数字图像数据集;
S2:构建用于从图像中识别手写体数字的卷积神经网络模型,所述卷积神经网络模型为七层结构,其中第一层到第七层依次为卷积层、池化层、卷积层、池化层、全连接层、全连接层和全连接层,且在第一层和第二层之间以及第三层和第四层之间分别加入一个SENet模块,用于建模通道之间的相互依赖关系;
S3:利用所述双通道手写体数字图像数据集,对所述卷积神经网络模型进行训练,得到手写体数字识别模型;
S4:将每张双通道手写体数字图像输入所述手写体数字识别模型中,获取模型中第六层全连接层中所有节点的参数以及该图像中手写体数字的标签;对于具有相同标签L的所有双通道手写体数字图像,计算所有图像对应的模型中第六层全连接层中所有节点的参数平均值,再转换为该标签L下的二进制码;所有手写体数字标签的二进制码构成码本;
S5:从待识别的手写体数字图片中提取轮廓信息,然后将该图片的原图和轮廓图进行通道相加,经过归一化后得到双通道手写体数字图片,输入所述手写体数字识别模型中获得模型中第六层全连接层中所有节点的参数,再转换为二进制码后计算与所述码本中所有二进制码的汉明距离,选择汉明距离最小的二进制码的标签作为识别结果;
S2所述卷积神经网络模型内的第一层卷积层的卷积核大小为5*5,卷积核数量为16个,并且采用RELU函数作为激活函数;第二层池化层的卷积核大小为2*2;第三层卷积层的卷积核大小为3*3,卷积核数量为64个,并且采用RELU函数作为激活函数;第四层池化层的卷积核大小为2*2;第五、六、七层全连接层的节点数量分别为120个,86个和10个,均用RELU函数作为激活函数;
S2中所述的SENet模块,首先将其前端卷积层的输出结果,分通道各自进行全局平均池化,然后将每个通道全局平均池化获得的结果通过两个全连接层,得到每个通道的权值,将权值加权相乘到每个通道的特征上,完成在通道维度上的对原始特征的重标定;
所述模型中第六层全连接层具有86个节点,其86个节点的参数平均值按照下式转换为
86位二进制数,其中第i个节点的参数平均值H(i)转换为第i位二进制数C(i)的规则为:
2.如权利要求1所述的基于卷积神经网络和编码的手写数字识别方法,其特征在于,S1中的训练数据采用MNIST手写体数字的训练集。
3.如权利要求1所述的基于卷积神经网络和编码的手写数字识别方法,其特征在于,S1中的训练数据中,每张手写体数字图像大小是28*28像素,通道相加后得到的双通道手写体数字图像数据集存储为28*28*2的数据形式。
4.如权利要求1所述的基于卷积神经网络和编码的手写数字识别方法,其特征在于,所述S3中,模型训练的batchsize设置为64,epoch设置为20。
5.如权利要求1所述的基于卷积神经网络和编码的手写数字识别方法,其特征在于,所述S1和S5中,通过Canny算子提取手写体数字图像中的轮廓信息。
6.如权利要求1所述的基于卷积神经网络和编码的手写数字识别方法,其特征在于,所述码本中具有0~9十个标签对应的0‑1二进制码。
7.如权利要求1所述的基于卷积神经网络和编码的手写数字识别方法,其特征在于,所述S5中待识别的手写体数字图片处理得到双通道手写体数字图片的具体方法,与S1中训练数据的处理方法相同。