利索能及
我要发布
收藏
专利号: 2022111962495
申请人: 中南民族大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种手写系统的抗干扰卷积神经网络手写数字识别方法,其特征在于,所述手写系统包括:手写文字收集系统、上位机;

所述手写文字收集系统与所述上位机连接;

所述手写文字收集系统用于采集用户手写数字图像,并根据手写数字图像标记手写数字图像的正确数字标签;

所述手写系统的抗干扰卷积神经网络手写数字识别方法,包括以下步骤:步骤1:手写文字收集系统获取由不同的用户手写的每幅手写数字图像,以及每幅手写数字图像的真实数字标签;

步骤2:构建干扰手写数字图像生成式对抗网络,将每幅手写数字图像通过干扰手写数字图像生成式对抗网络,预测得到每幅手写数字图像的加噪后弱点特征图像的预测标签,结合每幅手写数字图像的真实数字标签构建对抗网络损失函数模型,通过RMSprop迭代优化训练得到优化后干扰手写数字图像生成式对抗网络;

步骤3:通过手写文字收集系统采集实时手写数字图像,将实时手写数字图像输出至所述上位机,所述上位机通过所述优化后干扰手写数字图像生成式对抗网络的标签卷积神经网络预测,得到实时手写数字图像的预测标签;

步骤2所述干扰手写数字图像生成式对抗网络由标签卷积神经网络、干扰手写数字图像生成模块、生成器、判别器、弱点特征抽取模块、噪声放大模块构成;

所述的标签卷积神经网络、干扰手写数字图像生成模块、生成器、判别器依次连接;

所述的生成器、弱点特征抽取模块、噪声放大模块、标签卷积神经网络依次连接;

将每幅手写数字图像输入至所述干扰手写数字图像生成模块;

将每幅手写数字图像的加噪后弱点特征图像输入到标签卷积神经网络,标签卷积神经网络输出每幅手写数字图像的加噪后弱点特征图像的预测标签;

将每幅手写数字图像的加噪后弱点特征图像的预测标签输出至干扰手写数字图像生成模块;

在RMSprop初次迭代优化训练中,将每幅手写数字图像作为每幅手写数字图像的加噪后弱点特征图像;

所述每幅手写数字图像的加噪后弱点特征图像由所述噪声放大模块生成;

所述干扰手写数字图像生成模块,在多幅手写数字图像中筛选出Plbi≠Tlbi的手写数字图像定义为干扰手写数字图像,通过多幅干扰数据图像构建干扰数据集;

其中, 为第kj幅手写数字图像的加噪后弱点特征图像的预测标签;

为第kj幅手写数字图像的真实数字标签;

每幅干扰手写数字图像,定义如下:

其中, 为第j幅干扰手写数字图像,即第kj幅用户手写数字图像, 表示第i幅干扰手写数字图像第x行第y列的像素,M表示干扰手写数字图像的数量;

所述干扰手写数字图像生成模块将每幅干扰手写数字图像输出至所述生成器;

所述生成器结合每幅干扰手写数字图像、每幅干扰手写数字图像的d维随机向量 生成每幅生成器手写数字图像,将每幅生成器手写数字图像分别输出至所述的判别器、弱点特征抽取模块;

所述判别器输出每幅干扰手写数字图像为真的概率,定义为

所述判别器输出生成器手写数字图像为真的概率,定义为

所述弱点特征抽取模块由特征提取卷积神经网络构成;

所述弱点特征抽取模块将生成器手写数字图像通过特征提取,输出第kj幅手写数字图像的加噪后弱点特征图像的预测标签为 的概率为 得到每幅干扰手写数字图像的弱点特征图像,将每幅干扰手写数字图像的弱点特征图像输出至所述噪声放大模块;

所述噪声放大模块将每幅干扰手写数字图像的弱点特征图像通过拉普拉斯噪声进行加噪处理,得到每幅干扰手写数字图像的加噪后弱点特征图像,将每幅干扰手写数字图像的加噪后弱点特征图像输出至所述标签卷积神经网络;

所述标签卷积神经网络输出第kj幅手写数字图像的加噪后弱点特征图像的真实数字标签的概率为

2.根据权利要求1所述的手写系统的抗干扰卷积神经网络手写数字识别方法,其特征在于,步骤1所述每幅手写数字图像定义为:WDi={wdi(x,y)|x∈[1,U],y∈[1,V]}i∈[1,N]

其中,WDi表示第i幅用户手写数字图像,wdi(x,y)表示第i幅手写数字图像第x行第y列的像素,U表示第i幅手写数字图像的行数,V表示第i幅手写数字图像的列数;N表示手写数字图像的数量;

所述每幅手写数字图像的真实数字标签定义为:

{Tlbi},Tlbi∈[0,9]

其中,Tlbi为第i幅手写数字图像的真实数字标签。

3.根据权利要求2所述的手写系统的抗干扰卷积神经网络手写数字识别方法,其特征在于:步骤2所述对抗网络损失函数模型,具体定义如下:

Lall=αlcnn1+βLg+lossz+losscnn+Lp其中,Lall为总损失函数,α为特征提取卷积神经网络的权重,β为生成器的权重,lcnn1为特征提取卷积神经网络损失函数,Lp为判别器的损失函数,Lg为生成器的损失函数,lossz为随机向量逆运算损失函数,losscnn为标签卷积神经网络的损失函数, 为判别器输出第kj幅干扰手写数字图像为真的概率, 为判别器输出生成器第kj幅手写数字图像为真的概率, 为输出第kj幅手写数字图像的加噪后弱点特征图像的预测标签为 的概率,为第kj幅干扰手写数字图像d维随机向量中的第q个值, 为标签卷积神经网络输出第kj幅手写数字图像的加噪后弱点特征图像的真实数字标签的概率。