1.一种对于YOLOV3网络的检测算法改进方法,用于行人检测,其特征在于,包括以下步骤:步骤1,将主干网络的改进,主干网络加入残差模块Res‑Inc;对输入的特征图按通道对特征图进行切分,然后切分后特征图进入Res‑Inc模块进行通道混合操作;主干网络由若干个Res‑Inc模块串联而成,为了与YOLOV3统一,每隔两个Res‑Inc模块后会设置一个步长为2个的3*3卷积进行下采样;其中,残差模块Res‑Inc具体如下:首先对于输入的特征图,按通道对特征图进行切分,分为左右两个分支,左分支各有两对1*3、3*1卷积进行串联;然后进行通道混合操作,通道混合操作为:输入到通道混合层的特征图通道为C,将特征图分成g组;C能够被g整除,每组通道数n=C/g,将通道维度拆分成(g,n)两个维度,然后将这两个维度进行转置,最终再转换为一个维度;Res‑Inc两个分支中的空洞率设置不同的参数;
步骤2,特征图金字塔的改进;特征图金字塔加入自适应特征融合模块、注意力机制与特征增强模块;自适应特征融合模块的各层对不同尺度的特征图进行自适应加权融合后输
1 2 3
出本层的特征图,定义x ,x ,x为特征图金字塔中第一层、第二层和第三层的特征图,在进l行放缩和加权求和后,第l层的输出y如公式所示:
权重参数α,β和γ是对重定义过大小的level1~level3的特征图经过1*1卷积后得到三个参数;
采用自适应特征融合模块方式,梯度的公式为:
通过控制权重使 为0,使得负样本的梯度避免被反向传播回去以解决特征图金字塔中的不一致性;
注意力机制模块用于前馈卷积神经网络的有效注意,注意力机制模块依次沿着两个独立的维度,通道和空间推断注意图,将注意图倍增到用于自适应特征细化的输入特征映射;
特征增强模块用参数rate来表示空洞卷积层的空洞率参数,可根据需要自行修改,在特征增强模块中最后会将不同尺寸和空洞率的卷积层输出进行通道上的拼接;
步骤3,图像的数据进行增强处理;增强方式包括图像翻转、图像平移、图像尺寸缩放以及图片旋转;
步骤4,对于输出结果的损失函数的改进:输出结果加入分类损失函数和包围框位置损失函数;使用GIOU对包围框的损失函数进行修改,提升检测任务的效果,GIOU对于交并比指标改进;使用focal loss作为分类损失函数,focal loss对分类损失函数交叉熵损失的改进,focal loss的公式为:γ
FL(pt)=‑(1‑pt) log(pt)
γ
其中,γ为注意参数,γ>=0,(1‑pt) 为调制系数;
GIOU的计算方法如下:
步骤1,输入:预测框A,真实框B,S为所有框的集合,其中对于A和B,求得属于A、B得最小框C,C也属于集合S;
步骤2,计算A、B的IOU值,
计算GIOU值:
步骤3,输出:GIOU值。