利索能及
我要发布
收藏
专利号: 2024102119216
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种无人机视觉强跟踪方法,其特征在于,包括:

基于视频中的第一帧中目标的位置和大小,确定第一帧中的目标区域;

将第一帧中的目标区域中的目标旋转若干角度,提取不同角度下对应的目标包围框的宽高比,来构建目标旋转记忆库;

基于判别尺度空间跟踪器获取目标的位置滤波模型和尺度滤波模型;基于位置滤波模型和尺度滤波模型获取位置和尺度的响应图,并通过响应图获取滚动标准值;

根据滚动标准值判断跟踪过程中,跟踪信号的目标包围框是否将目标全部包围;若否,则从目标旋转记忆库中重新选取目标包围框的宽高比,使得目标包围框将目标全部包围;

若是,基于响应图输出目标的位置和尺度信息,实现对目标的抓取。

2.根据权利要求1所述的无人机视觉强跟踪方法,其特征在于,所述目标区域的获取包括以下步骤:采用移动边缘计算聚类分割算法对视频的第一帧中的每个像素进行标记,将第一帧划分为M个分量,每个分量定义为Rj,j=1,2,…M;

将Rj输入结合深度学习的宽度学习系统进行标准化和增广,得到特征节点矩阵和增强节点矩阵;使用伪逆计算每个特征节点和增强节点的权重来输出预测结果,基于预测结果确定第一帧中的目标区域。

3.根据权利要求2所述的无人机视觉强跟踪方法,其特征在于,所述初始位置滤波模型At‑1,trans,Bt‑1,trans和尺度滤波模型At‑1,scale,Bt‑1,scale的获取,包括以下步骤:第一帧中的目标区域输入到判别尺度空间跟踪器中,进行模型训练,推导出目标样本l l每个通道的滤波器h,其离散傅里叶变换为H:

在式(1)中,gt为对应的滤波器响应输出,由高斯函数构建得出;G表示为g的离散傅里叶变换, 表示G的复共轭,f表示特征,d为f特征对应的特征深度层数,l为f中每一层的特征;

F表示f的离散傅里叶变换,λ为权重参数;

l

将滤波模型H拆分成分子At和分母Bt,设ft表示当前帧的图像特征,前一帧目标位置记为pt‑1,前一帧的目标尺度记为st‑1;得到目标样本的位置滤波模型At‑1,trans,Bt‑1,trans与尺度滤波模型At‑1,scale,Bt‑1,scale。

4.根据权利要求3所述的无人机视觉强跟踪方法,其特征在于,所述通过响应图获取滚动标准值,包括以下步骤:基于目标样本的位置滤波模型At‑1,trans,Bt‑1,trans与尺度滤波模型At‑1,scale,Bt‑1,scale获取当前目标的位置响应图yt,trans和尺度响应图yt,scale,基于尺度响应图yt,scale得到每一帧相关响应的滚动标准值RSV:RA

RSVt=Ωt‑Ω             (5)

M×N

其中,Ωt=max(yt), t>1;Yt记为时间t的位置响应映射,yt∈R 为时间t的傅里叶反变换;RSVt为时间t的滚动标准值RSV的平均值。

5.一种无人机视觉强跟踪系统,其特征在于,包括:

预处理模块:基于视频中的第一帧中目标的位置和大小,确定第一帧中的目标区域;

记忆库模块:将第一帧中的目标区域中的目标旋转若干角度,提取不同角度下对应的目标包围框的宽高比,来构建目标旋转记忆库;

计算模块:基于判别尺度空间跟踪器获取目标的位置滤波模型和尺度滤波模型;基于位置滤波模型和尺度滤波模型获取位置和尺度的响应图,并通过响应图获取滚动标准值;

跟踪模块:根据滚动标准值判断跟踪过程中,跟踪信号的目标包围框是否将目标全部包围;若否,则从目标旋转记忆库中重新选取目标包围框的宽高比,使得目标包围框将目标全部包围;若是,基于响应图输出目标的位置和尺度信息,实现对目标的抓取。

6.一种终端设备,包括存储器、处理器及存储在存储器中并能够在处理器上运行的计算机程序,其特征在于,所述存储器中存储有能够在处理器上运行的计算机程序,所述处理器加载并执行计算机程序时,采用了权利要求1至4中任一项所述的一种无人机视觉强跟踪方法。

7.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器加载并执行时,采用了权利要求1至4中任一项所述的一种无人机视觉强跟踪方法。