利索能及
我要发布
收藏
专利号: 2021102963954
申请人: 西安理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于注意力模块增强的CNN楷体书法风格分类方法,其特征在于,具体按照以下步骤实施:步骤1、获取四种不同书法风格的图像,组成数据集并分成训练样本和测试样本;

步骤2、构建由卷积层,池化层,批量归一化层和非线性层组成的卷积块结构;

步骤2具体为:按照顺序将卷积层,最大池化层,批量归一层和非线性层排列在一起,并将它们封装在一个卷积块中;其中,卷积层的滤波器大小为5×5,步长为1;最大池化层的窗口大小为3×3,步长为2;非线性层使用ReLU激活函数;此外,在输入图像之后和第一个卷积块之间添加dropout层来减少过拟合,其概率设置为0.1;在第四个卷积块和全连接层之间添加flatten层来改变输入到全连接层的特征图的形状;

步骤3、将一个Dropout层、四个步骤2构造的卷积块、一个Flatten层及一个全连接层顺序排列在一起组成基线模型;

步骤4、向步骤3构造的基线模型中的第三个卷积块与第四个卷积块之间嵌入第一个CBAM、第四个卷积块与Flatten层之间嵌入第二个CBAM形成组合模型;

步骤5、设置损失函数和训练参数,将步骤1数据集中的训练样本与测试样本输入到步骤4构造的组合模型,进行训练与测试,训练每经过1个epoch,会在测试集上测试一遍当前网络的分类准确率,这个过程由设置的训练参数自动控制完成;

步骤6、将步骤5中训练结果中测试准确率最高的模型保存下来,作为书法风格分类模型,即为最终得到的书法风格分类器。

2.根据权利要求1所述的一种基于注意力模块增强的CNN楷体书法风格分类方法,其特征在于,步骤1具体按照以下步骤实施:步骤1.1、利用现有的最小包围盒算法从欧体,颜体,柳体及赵体四种不同书法风格的整幅楷书作品中分割出单个字符图像,每种风格的书法字符图像数量相等;

步骤1.2、从步骤1.1中获得的每种风格的书法字符图像中,按照3:1的比例分成训练集和测试集待用。

3.根据权利要求1所述的一种基于注意力模块增强的CNN楷体书法风格分类方法,其特征在于,步骤3中,四个卷积块中的卷积层滤波器组的数量分别为32,32,64,128;全连接层的神经元个数为4,激活函数为ReLU。

4.根据权利要求1所述的一种基于注意力模块增强的CNN楷体书法风格分类方法,其特征在于,步骤4中,CBAM由上下设置的通道模块及空间模块两部分组成;

通道模块由第一全局平均池化层、第一全局最大池化层、由第一全连接层及第二全连接层组成的多层感知机及ADD层组成;其中,全局平均池化层和全局最大池化层在输入特征图的每个通道切片上沿着空间维度进行;多层感知机中第一全连接层的神经元数量为输入特征图通道数的 ,并使用ReLU激活函数,第二全连接层的神经元数量为输入特征图的通道数;ADD层输出结果对其使用sigmoid激活函数;

空间模块由第二全局平均池化层、第二全局最大池化层、串连接层以及卷积层组成;其中,第二全局平均池化层和第二全局最大池化层在输入特征图的每个像素位置处沿着通道维度进行操作。

5.根据权利要求1所述的一种基于注意力模块增强的CNN楷体书法风格分类方法,其特征在于,步骤5中,损失函数选择交叉熵损失函数,并且使用小批量梯度下降算法优化网络模型;训练参数epoch为200,batch size为32,learning rate为0.0001。