利索能及
我要发布
收藏
专利号: 2019107822160
申请人: 电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种禁飞空域无人机检测方法,其特征在于,包括以下步骤:S1、样本获取及预处理:获取无人机飞行图像并进行标注,使用目标检测中水平的矩形框来标注无人机目标,并将标签数据保存;对图像进行预处理,包括图像裁剪、缩放、翻转、移位、亮度调整和加噪声,获得固定大小的样本图像;

S2、通过深度学习的方法训练无人机识别网络,无人机识别网络包括骨干网络、特征融合网络和预测网络,具体方法为:

S21、通过骨干网络对输入的样本图像进行特征提取,骨干网络以darknet53作为模板,包括52个卷积层,输入为预处理得到的样本图像,一次经过52个卷积网络,在这52个卷积层中选取第26层、第43层和第52层的特征图作为特征融合的特征图,该三层特征图的大小分别是52×52,26×26,13×13;

S22、特征融合网络用于将骨干网络得到的三个特征图做融合操作,先处理大小为13×

13的特征图,依次经过5个卷积,输出大小为13×13的融合特征图;之后将大小为13×13的融合特征图进行上采样,得到大小为26×26的采样特征图,并和骨干网络得到的大小为26×26的特征图做矩阵连接操作后经过5个卷积层得到大小26×26的融合特征图,对大小26×26的融合特征图做上采样得到大小为52×52的采样特征图,并和骨干网络得到的大小为

52×52的特征图做矩阵连接操作后经过5个卷积层得到大小52×52的融合特征图,通过上述操作得到三个经过特征融合的融合特征图,大小分别为52×52,26×26,13×13;

S23、预测网络包括三组两个卷积,每一组卷积的输入是融合后输出的融合特征图,预测的结果包括三个部分,分别是目标的坐标回归值(tx,ty,tw,th)、目标的置信度t0和目标的类别;三组网络的预测值大小分别为13×13×3×(4+1+1),26×26×3×(4+1+1),52×52×

3×(4+1+1),其中13、26、52表示特征图的大小,3表示矩形框的数量,4表示位置回归值,中间的1表示目标的置信度,后面的1表示类别,即只有无人机一类;

损失函数:损失函数计算主要分为三个方面,位置回归值的损失,目标置信度的损失和目标类别的损失,定义真值的中心点落到了特征图的某个网格中,则这个网格所对应的三个先验框就负责预测图像矩形框,同时分别计算三个先验框和真值的重叠度,取最大重叠度的那个先验框作为预测的回归框,在计算位置回归值损失和目标类别损失时只使用重叠度最大的那个先验框及其类别来计算,对于目标置信度损失既考虑重叠度最大的先验框的置信度损失,也要考虑重叠度较小的先验框的损失,即认为该先验框不能用来预测目标,即限制条件,总的目标置信度损失为两个部分之和;输入为预测网络得到的三组预测值,以及对应图像的标签数据,损失公式如下:

其中, 作为第i个格子第j个先验框第a个偏移角点用来预测无人机边界框, 表2

示第i个格子第j个先验框第a个偏移角点没有用来预测无人机边界框,s 表示特征图的大小,B表示矩形框的数量,(tx,ty,tw,th,t0,s)是预测得到的值,s表示预测的类别概率值,是真实值, 为坐标真实值, 为类别真实值,c∈{0,1}为总类别数目,σ(t0)表示预测得到的边界框的置信度分数,BCE为二元交叉熵函数,λcoord=1表示坐标损失的权值,λobj=5,λnoobj=0.5分别表示有目标和没有目标的损失权值;

S3、利用训练好的无人机识别网络对无人机图像进行预测,获得三组预测值;

S4、对预测值进行处理,获得无人机检测结果,具体为:S41、位置回归:在4个位置回归值中(tx,ty)表示平移预测值和(tw,th)表示缩放预测值,负责将先验框的坐标位置和宽高大小执行微调,具体微调方法为:在网格中定义四个角点(α,β,λ,δ),通过增加的四个角点会预测得到四组预测得到的矩形框(bx,by,bw,bh):α角点:

β角点:

γ角点:

δ角点:

其中,(cx,cy)为网格左上角和特征图左上角之间的偏移值,双曲正切函数tanh x将平移预测值(tx,ty)变换到(‑1,1)范围内,(pw,ph)为先验框的宽高, 是预测框的宽高,i∈(α,β,λ,δ);

S42、择优选择:选择大于给定阈值的预测值;

S43、预测框过滤:对于通过择优选择的预测矩形框仍然有很多,预测得到的无人机预测框可能存在同一个目标对应多个预测框,此时需要对多余的预测框进行过滤,得到最终的预测框:采用Soft‑NMS的方法将多余的预测框去除掉,最终得到图像上的每一个目标只得到一个预测框。