1.一种无人机航拍目标检测方法,其特征在于,所述方法包括如下步骤:
实时采集无人机航拍照片,将无人机航拍照片输入至预先训练好的目标检测模型,获得目标检测结果;
所述目标检测模型的训练过程包括:
收集航拍历史图像并进行预处理获得训练图像,构建训练数据集;所述训练图像包含目标真实标签;利用训练数据集对目标检测模型进行训练,所述目标检测模型包括CSPDarkNet特征提取网络、PANet图像金字塔和探测头;
将训练图像输入至所述CSPDarkNet特征提取网络获得不同尺寸的特征图feet1、特征图feet2和特征图feet3;具体包括:将训练图像依次输入至所述CSPDarkNet特征提取网络的focus模块、第一级混合卷积模块、第二级混合卷积模块、第三级混合卷积模块、simam注意力机制和SPPNet结构;通过第二级混合卷积模型输出特征图feet1,第三级混合卷积模型输出特征图feet2,SPPNet结构输出特征图feet3;
所述第一级混合卷积模块和第二级混合卷积模块设为由conv层和C3结构组成的残差块;所述特征图feet1由第二级混合卷积模型的C3结构输出;所述conv层由conv2d卷积层、Batchonrm函数和SiLU函数组成;所述第三级混合卷积模块内依次设置有conv层、第一Mixed‑Block层、conv层和第二Mixed‑Block层;所述特征图feet2由第一Mixed‑Block层输出;所述第二Mixed‑Block层与所述simam注意力机制连接;
将特征图feet1、特征图feet2和特征图feet3输入PANet图像金字塔进行特征融合操作生成特征图P1、特征图P2和特征图P3;
将特征图P1、特征图P2和特征图P3送入对应尺寸的探测头中获得先验框,基于目标真实标签对所述先验框进行评分,根据评分对特征图P1、特征图P2和特征图P3中的先验框进行非最大值抑制后获得最终的预测框;
将随机梯度下降法SGD作为目标检测模型的优化器,重复迭代直至达到设定的迭代次数输出训练好的目标检测模型。
2.根据权利要求1所述的一种无人机航拍目标检测方法,其特征在于,收集航拍历史图像并进行预处理获得训练图像的方法包括:对航拍历史图像进行随机的翻转、旋转和裁剪操作获得训练子图像,将多张训练子图像进行拼接获得训练图像。
3.根据权利要求1所述的一种无人机航拍目标检测方法,其特征在于,采用simam注意力机制对第二Mixed‑Block层输出的特征图进行处理的方法包括:;
;
;
;
公式中,X表示为输入simam注意力机制的特征图; 代表输入特征图X的单个通道上的神经元数量; 表示为输入特征图X的单个通道上的非目标神经元;t表示为输入特征图X的单个通道上的目标神经元; 表示为设定的调节参数。
4.根据权利要求1所述的一种无人机航拍目标检测方法,其特征在于,将特征图feet1、特征图feet2和特征图feet3输入PANet图像金字塔进行特征融合操作的方法包括:将特征图feat3进行1次1X1卷积调整通道获得特征图T3;对特征图T3进行上采样后,与特征图feat2进行结合并使用CSPLayer进行特征融合获得特征图T2_upsampl;
将特征图T2_upsampl进行1次1X1卷积调整通道获得特征图T2;对特征图T2进行上采样UmSampling2d后与特征图feat1进行结合,然后使用CSPLayer进行特征提取获得特征图P1;
对特征图P1进行3x3卷积和下采样后,与特征图T2堆叠并使用CSPLayer进行特征提取获得特征图P2;
对特征图P2进行3x3卷积和下采样后,与特征图T3堆叠并使用CSPLayer进行特征提取获得特征图P3。
5.根据权利要求1所述的一种无人机航拍目标检测方法,其特征在于,基于目标真实标签对所述先验框进行评分的方法包括:对探测头输出的预测数据进行解码,获得所述特征图P1的形状为(20,20,255)、特征图P2的形状为 (40,40,255)、所述特征图P3的形状为 (80,80,255)的数据;特征图P1、特征图P2和特征图P3的255个参数拆分为对应3个先验框的85个参数;其中,每组85个参数中前4个参数用于判断每一个特征点的回归参数,第5个参数用于判断每一个特征点是否包含物体,最后80个参数用于判断每一个特征点所包含的物体种类;通过对比目标真实标签和先验框的85个参数对先验框进行评分。
6.根据权利要求1所述的一种无人机航拍目标检测方法,其特征在于,根据评分对特征图P1、特征图P2和特征图P3中的先验框进行非最大值抑制后获得最终的预测框,方法包括:筛选评分大于设定评分阈值的先验框;根据评分对同一种类的先验框进行从大到小排序;每次取出评分最大的先验框,计算评分最大的先验框与其它所有先验框的重合程度,剔除重合程度大于设定的重合阈值的先验框后输出剩余先验框作为最终的预测框。
7.根据权利要求1至6任一项所述的一种无人机航拍目标检测方法的应用系统,其特征在于,包括:实时检测单元,用于实时采集无人机航拍照片,将无人机航拍照片输入至预先训练好的目标检测模型,获得目标检测结果;
数据集构建单元,用于收集航拍历史图像并进行预处理获得训练图像,构建训练数据集;所述训练图像包含目标真实标签;
输入单元,用于利用训练数据集对目标检测模型进行训练,所述目标检测模型包括CSPDarkNet特征提取网络、PANet图像金字塔和探测头;
训练单元,用于将训练图像输入至所述CSPDarkNet特征提取网络获得不同尺寸的特征图feet1、特征图feet2和特征图feet3;将特征图feet1、特征图feet2和特征图feet3输入PANet图像金字塔进行特征融合操作生成特征图P1、特征图P2和特征图P3;将特征图P1、特征图P2和特征图P3送入对应尺寸的探测头中获得先验框,评分单元,用于基于目标真实标签对所述先验框进行评分;
优化迭代单元,用于根据评分对特征图P1、特征图P2和特征图P3中的先验框进行非最大值抑制后获得最终的预测框;将随机梯度下降法SGD作为目标检测模型的优化器,重复迭代直至达到设定的迭代次数输出训练好的目标检测模型;
所述训练单元将训练图像输入至所述CSPDarkNet特征提取网络获得不同尺寸的特征图feet1、特征图feet2和特征图feet3,具体包括:将训练图像依次输入至所述CSPDarkNet特征提取网络的focus模块、第一级混合卷积模块、第二级混合卷积模块、第三级混合卷积模块、simam注意力机制和SPPNet结构;通过第二级混合卷积模型输出特征图feet1,第三级混合卷积模型输出特征图feet2,SPPNet结构输出特征图feet3;
所述第一级混合卷积模块和第二级混合卷积模块设为由conv层和C3结构组成的残差块;所述特征图feet1由第二级混合卷积模型的C3结构输出;所述conv层由conv2d卷积层、Batchonrm函数和SiLU函数组成;所述第三级混合卷积模块内依次设置有conv层、第一Mixed‑Block层、conv层和第二Mixed‑Block层;所述特征图feet2由第一Mixed‑Block层输出;所述第二Mixed‑Block层与所述simam注意力机制连接。
8.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至权利要求6任一项所述无人机航拍目标检测方法的步骤。