1.一种基于自适应堆叠胶囊自编码器的图像识别方法,其特征在于,包括以下步骤:步骤1:获取待分析的图像;
步骤2:构建自适应堆叠胶囊自编码器ASCAE;
步骤3:将待分析的图像输入到ASCAE中;
步骤4:利用ASCAE重建图像,并利用分类器实现图像识别,输出识别出的图像。
2.如权利要求1所述的一种基于自适应堆叠胶囊自编码器的图像识别方法,其特征在于,步骤2中的自适应堆叠胶囊自编码器ASCAE包括部件胶囊自编码器PCAE和对象胶囊自编码器OCAE,所述胶囊自编码器PCAE包括一个编码器和一个解码器,PCAE的解码器中设置了自适应模块AM,自适应AM模块为由两层全连接层组成的全连接神经网络。
3.如权利要求2所述的一种基于自适应堆叠胶囊自编码器的图像识别方法,其特征在于,所述胶囊自编码器PCAE的编码器中设置了一个ResCNN深度卷积模块以及与其输出相连的注意力池化层,ResCNN深度卷积模块用于对输入的原始图像进行卷积计算并得到特征图,并将特征图输出到注意力池化层,注意力池化层用于将输入的特征图转换为部件胶囊。
4.如权利要求3所述的一种基于自适应堆叠胶囊自编码器的图像识别方法,其特征在于,所述部件胶囊包括特殊特征组件、图像特征组件、存在概率组件和姿态组件:存在概率组件,用于描述部件在图像中存在的可能性;
姿态组件,用于描述部件的空间几何信息;
图像特征组件,用来表示部件的外观信息;
特殊特征组件,用于描述除了部件的外观之外的其他图像特征,并作为OCAE的输入数据。
5.如权利要求4所述的一种基于自适应堆叠胶囊自编码器的图像识别方法,其特征在于,所述自适应模块AM用于根据部件胶囊的图像特征映射绘制部件胶囊的外观,形成局部图像的图块,这些图块再通过几何变换改变姿态,最终形成重建图像。
6.如权利要求4所述的一种基于自适应堆叠胶囊自编码器的图像识别方法,其特征在于,所述ResCNN卷积模块包括4个依次连接的残差块,每个残差块包含三个卷积层以及一个从第一个卷积层到第三个卷积层的残差连接。
7.如权利要求6所述的一种基于自适应堆叠胶囊自编码器的图像识别方法,其特征在于,步骤4的具体操作步骤包括:步骤4.1:获取输入的待分析图像I,将其记为I(h,w,c),其中h为高度,w为宽度,c为通道;
步骤4.2:将图像I输入到PCAE的编码器中,将I转换成M个部件胶囊,即:s i
其中,PE表示PCAE的编码器,x表示姿态,d表示存在概率,z 表示特殊特征,z 表示图像特征,下标1:M表示从1到M;
步骤4.3:自适应模块AM通过下面的投影公式将所有的M个图像特征投影为M个图像块,每个 均包含一个编码后的部件胶囊的外观信息,所述投影公式为:其中,Tm的高度、宽度和通道分别为ht,wt,c;m∈(1,M); 表示第m个部件胶囊所包含的图像特征;
步骤4.4:PCAE解码器为每个图像块Tm对应学习一个alpha通道步骤4.5:基于部件胶囊中的姿态xm,将Tm和 进行仿射变换,得到变换后的图像块和其中,Transform表示仿射变换;
步骤4.6:通过下式将 存在概率dm进行联合计算,得到重建图像:其中,表示得到的重建图像,⊙表示图像中相应元素的乘积;
步骤4.7:利用得到的重建图像 和原始图像I使用均方误差Lmse计算重建图像和原始图像的损失值,从而对PCAE进行训练;
步骤4.8:将部件胶囊的特殊特征 输入到OCAE中,并将xm、dm和 连接在一起得到一个令牌,将M个部件胶囊所形成的M个令牌由OCAE的编码器编码为K个对象胶囊;
步骤4.9:利用OCAE的对象解码器将与其对应的对象胶囊解码为5个分量:OVk,ak,OPk,1:M,ak,1:M,λk,1:M=MLPk(ck)其中,MLPk表示由多层感知机实现的对象解码器,OVk表示3×3大小的对象‑观察者关系矩阵,ck表示第k个对象胶囊,ak表示ck的存在概率,OPk,1:M表示3×3对象‑部件关系矩阵,ak,1:M表示部件胶囊的预测存在概率,λk,1:M表示相关的标准差;
步骤4.10:根据下式得到第k个对象胶囊对第m个部件胶囊的预测姿态μk,m:μk,m=OVkOPk,m
其中,OVk表示对象胶囊和图像观察者之间的仿射变换,OPk,m表示对象胶囊与部件胶囊之间的仿射变换;
步骤4.11:通过下式将姿态建模为单个高斯混合:
p(xm|k,m)=N(xm|μk,m,λk,m)
其中,p表示高斯混合,λk,m表示第m个部件胶囊的标准差;
步骤4.12:通过下式计算姿态似然Lpose,并通过最大化Lpose来训练OCAE,姿态似然Lpose的计算公式为:其中,ak表示第k个对象胶囊的存在概率,所有的存在概率ak构成一个具有k个元素的存在向量;ak,m表示第k个对象胶囊对第m个部件胶囊的存在概率的预测结果,ai,j表示第i个对象胶囊对第j个部件胶囊的存在概率的预测结果;
步骤4.13:通过最小化Lmse和最大化Lpose建立ASCAE的损失函数:L=Lmse‑Lpose
其中,L表示ASCAE的损失函数;
步骤4.14:使用由所有对象胶囊的存在概率ak所组成的存在向量表示输入图像I的特征码,基于构建的损失函数L训练ASCAE模型从而优化特征码,分类器再利用优化后的图像I的特征码实现图像分类,输出图像识别结果。