利索能及
我要发布
收藏
专利号: 2022103131288
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于自适应背景感知和空间注意力机制的目标跟踪方法,其特征在于,包括如下步骤:步骤1,采集视频图像,获取被跟踪目标的位置及特征信息,建立视频图像序列对应的样本矩阵Ai,i表示视频帧数;

步骤2,通过空间注意力机制预处理图像样本矩阵Ai,调整图像样本不同位置处特征的注意力权重,建立空间特征增强图像样本集Zi;

步骤3,对步骤2预处理得到的特征增强图像样本集Zi循环采样,并建立滤波器模型的目标函数,通过训练滤波器模型实现目标跟踪;具体内容为:利用步骤2中预处理后获得的空间特征增强图像样本Zi,对其进行循环采样,在Zi的目标周围平移建模,获得循环矩阵Z0,则滤波器跟踪模型的目标函数表达式为:式中,y是理想高斯响应矩阵,即图像的矢量化回归目标;λ1是正则化参数;w是相关滤波器;

步骤4,利用自适应空间正则化策略优化滤波器模型,通过对滤波器施以自适应权重,分配样本目标与背景区域的特征资源,调整图像样本与理想高斯模板的动态关系;

步骤5,通过自适应背景感知方法再次优化滤波器模型,通过获取图像样本的背景信息,筛选背景中易产生跟踪干扰的信息构成负样本矩阵,利用此负样本矩阵训练滤波器,并更新滤波器模型求解的目标函数;

步骤6,通过傅里叶变换和交替方向乘子算法优化步骤5中滤波器模型的目标函数,进而更新跟踪模型,通过求解最优滤波器参数,定位目标,并获取目标当前帧中的位置。

2.根据权利要求1所述的目标跟踪方法,其特征在于,所述步骤2包括:步骤201,将样本矩阵Ai中图像样本xi输入至空间注意力机制模块,通过高斯函数形式计算任意位置a处样本xa与其它所有可能位置b处样本xb交互关系,表达式为:T

式中,xa xb表示点积相似性,T表示转置运算;h函数值与b位置对a位置影响大小成正比;

步骤202,再计算图像样本xi中各像素点的特征权重,表达式为:g(xb)=Υgxi

式中,Υg表示权重矩阵;

步骤203,空间注意力模块对样本矩阵特征图的每个位置进行空间注意力调整,得到经过加权样本特征Za,表达式为:式中,H表示归一化参数;

使用全局平均池化生成空间信息统计,将每一帧的全局空间样本特征Za整合为空间注意力图像样本矩阵Zi。

3.根据权利要求1所述的目标跟踪方法,其特征在于,所述步骤4包括:步骤401,引入滤波器空间先验信息作为预定义空间参考模板,且该参考模板初始为高斯形状分布,建立当前帧图像样本的滤波器与预定义空间参考模板之间最小化关系f(w)1,表达式为:式中,λ1、λ2是正则化参数;w是相关滤波器;w′是预定义空间参考模板,该模板随目标运动而变化;

步骤402,利用自适应空间正则化策略作用于滤波器模型,则滤波器跟踪模型的目标函数表达式为:

4.根据权利要求3所述的目标跟踪方法,其特征在于,所述步骤5包括:步骤501,采集图像样本中目标周围的背景干扰信息,获得当前帧目标样本与滤波器相关滤波响应结果矩阵R;通过自适应背景感知方法筛选目标周围滤波响应值较高的区域,记为响应图局部最值Rl,则Rl可以通过下式计算得到:Rl=imregionalmax(R),l=1,2,3…式中,l表示当前帧响应值较高的位置;

步骤502,取响应图局部最值Rl中仅次于目标中心最大响应值的三个次大值R1、R2、R3,扩展至图像样本的后续每一帧,构成一组背景干扰样本集,用背景感知负样本Zj表示;

步骤503,利用背景感知负样本对滤波器进行训练,使滤波器在目标样本处响应值较高,其余背景样本处响应值接近于零,计算背景感知负样本的响应值f(w)2表达式为:式中,λ3表示正则化系数;

步骤504,增加自适应背景感知模块后,更新滤波模型目标函数,则基于自适应背景感知和空间注意力机制的滤波器跟踪模型目标函数归纳如下:步骤505,将目标样本循环矩阵Z0与背景感知负样本Zj合并为表示样本特征的循环矩阵Q,将响应矩阵y转化为 保持滤波器对目标与背景样本的相应约束,使目标样本接近理想回归目标y、背景感知负样本接近于0,则滤波器跟踪模型的目标函数表达式修改为:式中,

5.根据权利要求4所述的目标跟踪方法,其特征在于,所述步骤6包括:步骤601,将函数Fp(w,Q)于傅里叶域中最小化,对相关滤波器w求偏导,表达式为:式中,I表示单位矩阵;

步骤602,利用循环矩阵的对角化性质以及其可逆性,将循环矩阵表示为对应特征向量,化简后的滤波器表达式为:式中,F是离散傅里叶矩阵;

步骤603,利用循环矩阵卷积定理,将滤波器求解转换到傅里叶域中,获得滤波器最优解 表达式为:步骤604,用前一帧滤波器 与当前帧图像样本特征进行相关性计算,得到相应结果图,取响应值最大处对应位置,即为当前帧目标定跟踪结果。