1.一种基于FractalNet网络的改进手势图像特征提取方法,其特征在于:包括如下步骤:
1)对各种手势进行图像采集获得原始图像,对原始图像进行尺寸归一化处理获得原始手势图像;
2)将原始手势图像输入R‑FractalNet1网络结构,获得原始特征向量;
3)将原始特征向量和原始手势图像输入到空间特征金字塔结构,进行特征提取获得多尺度特征;
4)将原始特征向量输入到R‑FractalNet2网络结构中,获得通道数扩张后的低阶特征向量;
5)将空间特征金字塔结构输出的多尺度特征和R‑FractalNet2网络结构输出的低阶特征向量在通道维度上进行拼接后再输入到R‑FractalNet3网络结构中,进行特征在通道上的融合,输出高维特征向量;
6)将高维特征向量经过全局平均池化层之后再经过一个全连接层,最后输入softmax分类器中,获得手势图像的分类结果。
2.根据权利要求1所述的一种基于FractalNet网络改进的手势图像特征提取方法,其特征在于:所述的R‑FractalNet3网络结构拓扑结构主要由三个四阶卷积模块依次连接构成,所述的R‑FractalNet1网络结构和R‑FractalNet2网络结构拓扑结构相同,均主要由一个四阶卷积模块和最大池化层依次连接构成。
3.根据权利要求2所述的一种基于FractalNet网络改进的手势图像特征提取方法,其特征在于:所述的四阶卷积模块包括两个三阶卷积模块、一个四阶单卷积模块和一个相加层,两个三阶卷积模块连续连接后形成四阶连续卷积块,四阶卷积模块的输入分别经四阶连续卷积块、四阶单卷积模块处理后的结果经相加层进行相加处理得到四阶卷积模块的输出,再输入到最大池化层;
三阶卷积模块包括两个二阶卷积模块、一个三阶单卷积模块和一个相加层,两个二阶卷积模块连续连接后形成三阶连续卷积块,三阶卷积模块的输入分别经三阶连续卷积块、三阶单卷积模块处理后的结果经相加层进行相加处理得到三阶卷积模块的输出;
二阶卷积模块包括两个一阶卷积模块、一个二阶单卷积模块和一个相加层,两个一阶卷积模块连续连接后的整体并联叠加残差模块后形成二阶连续卷积残差块,二阶卷积模块的输入分别经二阶连续卷积残差块、二阶单卷积模块处理后的结果经相加层进行相加处理得到二阶卷积模块的输出;
四阶单卷积模块、三阶单卷积模块、二阶单卷积模块结构均和一阶卷积模块相同,所述的一阶卷积模块具体为一个卷积层、一个标准化层和一个relu激活函数依次连接组成。
4.根据权利要求2或3所述的一种基于FractalNet网络改进的手势图像特征提取方法,其特征在于:所述的四阶卷积模块f4(z)按照以下公式设置处理:
其中,z表示输入的特征向量,表示依次组合操作, 表示相加操作,relu代表relu激活函数,bn代表一个Batch Normalization层,即一个标准化层,c表示对应阶数,fc(z)表示c阶卷积模块,c=1‑4;Res(*)为并联叠加残差模块的操作。
5.根据权利要求3所述的一种基于FractalNet网络改进的手势图像特征提取方法,其特征在于:所述残差模块选择为残差映射或者恒等映射,其中,和网络结构的输入直接相连接的两个连续的一阶卷积模块所并联叠加的残差模块为残差映射,其余残差模块为恒等映射;残差映射是主要由扩张图像的通道维度和缩小图像的大小维度的操作构成,恒等映射是不经过任何操作直接将输入进行输出。
6.根据权利要求1所述的一种基于FractalNet网络改进的手势图像特征提取方法,其特征在于:所述步骤3)中,空间特征金字塔分为三个分支:以低阶特征分支分支作为第一分支,以细节特征分支作为第二分支,以边缘特征提取分支作为第三分支,原始手势图像经过第一分支处理获得高宽维度上缩小4倍的特征向量,原始特征向量经过第二分支、第三分支处理获得各自高宽维度上缩小2倍的特征向量;
第一分支主要主要由一个卷积层、一个平均池化层和一个relu激活函数依次连接组成;
第二分支主要由一个卷积核大小为1×1的卷积层和一个卷积核大小为2×2的最大池化层依次连接组成;
第三分支主要由一个采用nearst模式的下采样层、一个采用nearst模式的上采样层和一个最大池化层依次连接组成。