利索能及
我要发布
收藏
专利号: 2024117796322
申请人: 东北电力大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于改进YOLO11n的无人机航拍车辆检测方法,其特征在于,具体包括以下步骤:步骤1:获取无人机航拍车辆图像,形成第一数据集;所述第一数据集中的图像可通过无人机摄像头进行拍摄或者从网络中收集获取;

步骤2:为所述第一数据集中的图像添加标注信息,形成第二数据集,并将所述第二数据集划分训练集、验证集和测试集;

步骤3:构建基于改进YOLO11n的无人机航拍车辆检测模型,所述模型包括Backbone网络、Neck网络和Head网络,所述模型的构建进一步包括步骤3.1至步骤3.4:步骤3.1:所述Backbone网络,由5个Conv模块、4个C3k2模块、1个SPPF模块和1个C2PSA模块组成;所述第二数据集中的训练集和验证集作为所述Backbone网络的输入;

步骤3.2:所述Neck网络,由2个upsample模块、4个Concat模块、4个C3k2模块、2个Conv模块、1个SPD‑Conv模块和1个CSP‑OmniKernel模块组成,形成新的特征金字塔,命名为SOEFPN;

所述SPD‑Conv模块通过处理P2特征层输出的特征,得到含有小目标信息的特征,再传递到P3特征层进行特征融合;SPD‑Conv模块由SPD层和非步长卷积层组成,首先使用SPD层,将特征图的空间维度转换成深度维度,然后使用非步长卷积层,保持了空间维度,减少了通道数;

所述CSP‑OmniKernel模块中,OmniKernel是一种完全核形态的图像恢复网络,由全局分支、大分支和局部分支三个分支组成,能够合理地将卷积核扩展到特征大小,有效地学习从全局到局部的特征表征;CSP思想的引入将输入特征分为两部分:一部分经过OmniKernel模块,生成自适应的特征;另一部分保留输入特征,作为轻量化的路径,减少计算开销;

步骤3.3:所述Head网络包括3个Dyhead‑DCNv4检测头,颈部网络中3个C3k2模块的输出分别作为3个Dyhead‑DCNv4检测头的输入;

所述Dyhead‑DCNv4检测头,在Dyhead检测头的基础上,将可变形卷积DCNv2替换为DCNv4;Dyhead‑DCNv4相对于Dyhead,增加了一个动态权重生成模块weight,在卷积中同时使用offset和weight进行卷积操作,提升检测性能,减少计算开销;

步骤3.4:将原模型中损失函数替换为Inner‑SIoU函数,优化后的损失函数公式为:;

inner

式(1)中,LSIoU表示SIoU函数的损失;IoU 表示Inner‑IoU损失函数;IoU表示预测框和真实框之间的交并比;LSIoU的计算公式为:;

式(2)中,Δ表示距离损失,Ω表示形状损失;

inner

式(1)中,IoU 的计算公式为:

式(3)中,inter表示预测框与真实框交集区域的面积;union表示预测框与真实框并集区域的面积;计算公式分别是:;

式(4)和式(5)中, 和br分别表示真实框和预测框的右边界横坐标; 和bl分别表示真实框和预测框的左边界横坐标; 和bb分别表示真实框和预测框的下边界纵坐标; 和bt分别表示真实框和预测框的上边界纵坐标; 和 分别表示真实框的宽度和高度;w和h分别表示预测框的宽度和高度;ratio对应缩放因子;

步骤4:利用训练集和验证集对所述基于改进YOLO11n的无人机航拍车辆检测模型进行训练,将训练好的模型保存为最优模型;所述基于改进YOLO11n的无人机航拍车辆检测模型训练过程,进一步包括步骤4.1至步骤4.4:步骤4.1:设置所述基于改进YOLO11n的无人机航拍车辆检测模型训练参数;

模型训练参数包括:迭代轮数、批次大小、优化器、学习率、动量、权重衰减和线程数;

步骤4.2:将所述训练集和验证集以及对应标签输入到所述改进YOLO11n的无人机航拍车辆检测模型中,使用反向传播算法计算损失函数对模型参数的梯度,通过最小化损失函数调整模型参数使其逐渐接近最优解;

步骤4.3:使用优化器SGD来更新模型参数,使模型参数朝着梯度下降的方向更新,直到训练集和验证集的损失函数不再下降,同时评价指标均值平均精度mAP、召回率R、准确率P也不再提高;

步骤4.4:将训练好的模型参数保存为最优模型;

步骤5:采用所述测试集对所述最优模型进行测试,对测试集测试结果进行评估,满足精度要求,即获得最终基于改进YOLO11n的无人机航拍车辆检测模型。

2.根据权利要求1所述的一种基于改进YOLO11n的无人机航拍车辆检测方法,其特征在于,所述步骤3.2中,设计了一个针对小目标车辆的特征金字塔SOEFPN;首先,使用P2特征层经过SPD‑Conv处理得到含有小目标信息的特征,然后将特征传递到P3特征层进行融合,再使用CSP‑OmniKernel进行特征整合,以有效地学习从全局到局部的特征表征,提高对小目标车辆的检测性能。

3.根据权利要求1所述的一种基于改进YOLO11n的无人机航拍车辆检测方法,其特征在于,所述步骤5进一步包括步骤5.1至步骤5.3:步骤5.1:将所述测试集输入到所述最优模型中;

步骤5.2:计算模型性能指标:准确率P、召回率R、均值平均精度mAP、参数量、模型大小,具体计算公式如下:;

其中,P为准确率,R为召回率,mAP为所有类别的平均精确率均值,AP为平均精确率,m为车辆总类别数,TP表示正样本被正确识别为正样本的个数,FP表示负样本被错误识别为正样本的个数,FN表示正样本被错误识别为负样本的个数;

步骤5.3:当性能指标满足精度要求时,获得最终基于改进YOLO11n的无人机航拍车辆检测模型。