利索能及
我要发布
收藏
专利号: 2017111205846
申请人: 中国计量大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多分辨率的图像分类方法,其特征在于:步骤1:数据集准备,数据集含N种类别,每类含M种分辨其中W为图片的宽,H为图片的高,M=0,1,2,...n,每种分辨率的图片数量相近,将图片分成训练集和测试集两个部分;

步骤2:制作图片标签,标签表示为l(l∈(1,N)),表示属于第几类,在训练集中,同一类别的图片标签保持一致,不同类别的标签不能相同;

步骤3:构建图片数据库,在深度卷积神经网络训练时需要输入训练数据,利用准备好的数据集和标签将图片数据转换为lmdb格式,所述lmdb为内存映射数据库,读取的效率更高,而且支持不同程序同时读取;

步骤4:针对多分辨率输入设计了两种网络结构,确定深度神经网络输入层节点数、输出层节点数、隐藏层数和隐藏层节点数,随机初始化各层的连接权值W和偏置b,给定学习速率η,选定激活函数RELU,选定损失函数Loss,所述激活函数的作用是能够给神经网络加入一些非线性因素,使得神经网络可以更好地解决较为复杂的问题,RELU的数学表达式为:步骤5:训练深度神经网络直到神经网络输出层误差达到精度要求或训练次数达到最大迭代次数,结束训练,保存网络结构和参数,得到训练好的神经网络模型;

步骤6:输入任意一张测试图片到训练好的神经网络模型中,神经网络的输出即为该图片的类别;

所述步骤4中,第一种深度神经网络结构,采用跳过部分池化层的方法,所述池化层在卷积层后面,通过池化层来降低卷积层输出的特征向量,结构一中跳过池化层的个数取决于输入图片的分辨率大小和最小分辨率的图片大小;

跳过的个数为:

在特征图大小统一前,不同分辨率图片共同作用卷积层和激活层,单独作用池化层,在特征图大小统一后共同作用卷积层、激活层和池化层。

2.根据权利要求1的基于多分辨率的图像分类方法,其特征在于:所述步骤4中,第二种深度神经网络结构,采用指定位置输入的方法,结构二中不跳过池化层,利用池化层能够降低特征图大小的的性能以2M倍采样特征图,将不同分辨率的图片与不同大小的特征图相匹配,将输入图片定位到大小匹配一致的特征图前一层,所述输入图片在与特征图结合前经过卷积激活处理。

3.根据权利要求1的基于多分辨率的图像分类方法,其特征在于:所述步骤4中,根据卷积网络不同层得到的特征特点不同,对不同层的特征采用不同的利用方式,利用低层细节更加清楚的特点进行小目标分类,利用高层包含信息更多的特点进行大目标分类,所述小目标与大目标为某一类物体所占图片像素的大小,一张图片中占大部分像素的物体为大目标,反之为小目标,将不同层提取的特征连接得到一个既包含细节又包含总体信息的特征向量;

该向量可用具体公式表示为:

其中RELUj表示深度神经网络的第j个池化层输出,RELUlast表示深度神经网络的最后一个池化层输出;

该向量经过全连接层后输入到softmax层进行类别判断,所述softmax函数是一个归一化的指数函数,可以用于解决多分类问题;

softmax函数定义如下:

yi=ezi/∑nezi i=1,2,3,...,n                       (4)其中yi为概率,zi为特征向量z中的第i个元素;

式子中的分母起正则项的作用,∑nezi=1,所述正则项为保留一些更为重要的特征变量,舍弃不需要的变量,该图像分类方法中需要判断输入图片的类别,重点考虑输入图片可能的类别,不考虑概率小的类别;

根据最大化似然函数就是最小化它的负对数的似然函数可得,损失函数为:Loss=-log(ezi/∑nezi)             (5)。