买专利、卖专利、专利购买、专利交易、专利出售、高企申报-结合粒子滤波及度量学习的视频目标跟踪方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

结合粒子滤波及度量学习的视频目标跟踪方法

面议

专利号： 2020109675493

申请人：浙江理工大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种结合粒子滤波及度量学习的视频目标跟踪方法，其特征在于：包括如下步骤：步骤1：离线训练获得目标高层抽象特征的卷积神经网络；

步骤2：基于核回归度量学习方法学习加权距离度量矩阵以最小化核回归预测误差，并通过梯度下降法求解所得最优化问题进而获得表征最优候选目标的距离度量矩阵；

步骤3：基于最优候选目标预测值计算重构误差，并通过粒子滤波构建目标观测模型，获取目标状态最优估计；

步骤4：引入短时与长期稳定更新相结合的更新策略实现目标有效跟踪。

2.如权利要求1所述的结合粒子滤波及度量学习的视频目标跟踪方法，其特征在于：步骤1通过深度卷积网络AlexNet构造视频跟踪特征深度提取模型，深度特征提取模型输入图片规格为227*227像素，网络第一层卷积核尺寸设置为11*11*96，步长为4，卷积核个数为

64，第一卷积层后接具有3卷积核的卷积层，设置第五卷积层中卷积核尺寸为3*3*256、步长为1，提取图像中目标背景样本作为后续度量学习样本，在第一、二和五卷积层后衔接尺寸为3*3、步长为2的池化层，第五卷积层后衔接三个全连接层，基于全连接层取得融合特征，分类层通过SoftMax函数分类以区分目标背景，卷积层激活函数均采用ReLU函数，且卷积层后具有归一化层，视频跟踪特征深度提取模型基于给定运动目标视频序列离线训练AlexNet网络，得到目标高层抽象特征的卷积神经网络。

3.如权利要求1所述的结合粒子滤波及度量学习的视频目标跟踪方法，其特征在于：步骤2具体包括如下步骤:通过训练样本集x＝(x1,x2,...,xn)∈RB×N核回归度量学习，将训练样本数据映射至高可分性空间，获取表征目标特征差异的距离度量：其中，xi,xj∈RB×N为样本，B为训练样本特征维度，N为样本数量，DA(xi,xj)为样本xi和xj之间的马氏距离，||·||2表示样本间距离平方，M∈RB×B为度量矩阵，M＝ATA，A∈Rb×B视为从原始特征空间RB到新度量空间Rb的映射矩阵，其中b＜＜B，则：DA(xi,xj)＝||A(xi-xj)||2＝(xi-xj)TATA(xi-xj) (2)核回归中样本xi的目标估计值通过邻近样本加权平均获得：其中，c为样本xi的邻近数，y＝(y1,y2,...,yn)∈{0,1}为样本xn对应类别标签，Kij为xi与临近样本xj之间高斯核距离函数，表征二者之间相似性表示为：其中，δ为正则化常量；

采用累积二次回归误差表征训练样本集平方误差L，并最小化误差L获得最优映射矩阵A：采用梯度下降方法求解，基于链式法则，问题(5)中目标函数关于变量A的导数表示为：表示为：

表示为：

其中

得：

基于梯度下降法迭代更新映射矩阵A：

其中，ρ为学习速率，f为迭代次数，将所得最优映射矩阵A代入M＝ATA，求得最优度量矩阵M。

4.如权利要求1所述的结合粒子滤波及度量学习的视频目标跟踪方法，其特征在于：步骤3具体包括如下步骤：设m个候选目标Y＝[Y1,Y2,…,Ym]由包含w个模板的模板集T＝[t1,t2,…,tw]表示，将每个模板分割为W个局部块，则模板集的第g个局部块表示为：Tg＝[t1g,t2g,…,twg]∈Rb×w，其中，tig,i＝1,2,…,w为第i个模板的第g个局部块；将每个候选目标Yg分割为W个局部块{yg|g＝1,2,…,W}∈Rb×1，利用特征映射A对每个yg进行核回归距离度量，则得如下关于候选目标度量系数的最小化问题：其中，zg∈Rw×1为模板局部块g对应系数向量，λ为惩罚参数，||·||2为l2范数，||·||1为l1范数；

优化问题视为W个优化问题的累加，且各优化变量相互独立，将优化问题拆分为W个子优化问题：通过加速近端梯度算法实现高效求解，对应候选目标重构误差表示如下：基于式(14)计算所有候选目标的重构误差{ε1,ε2,…,εm}，则候选目标Yg的似然模型构建为：其中，Γ是归一化因子，γ为控制高斯核的参数；

将式(15)所得带入式(16)获取目标状态最优估计；

实给定观测图像X1:r＝{x1,x2,…,xr}及其对应状态H1:r＝{h1,h2,…,hr}，基于粒子滤波递归估计目标最优状态：其中，∝为正比算子，为观测模型，表征状态下图像xr出现概率，为在第r帧中第i个候选粒子对应状态值；

给定1到r帧的观测结果X1:r，基于贝叶斯推理框架递归推导式(12)获得当前帧中最优目标状态，得：其中，为相邻状态间运动模型，表示连续两帧间目标状态相关性；

最优目标状态基于如下最大后验估计获得：

设时刻r下目标状态向量为hr＝{hrx,hry,scr,θr,φr,σr}，其中hrx,hry,scr,θr,φr,σr为六自由度仿射变换参数，分别表示水平位移、垂直位移、旋转角度、水平尺度因子、扭曲角和宽高比例，假设状态变量相互独立且服从高斯分布，相邻帧间目标运动模型构建如下：其中，表示服从均值为hr-1、方差为∑的高斯分布，∑为对角协方差矩阵，其元素为仿射参数方差；

候选目标仅在最临近帧中更新估计，当运动模型固定时，最优候选目标直接基于观测模型选择。

5.如权利要求1所述的结合粒子滤波及度量学习的视频目标跟踪方法，其特征在于：步骤4具体包括如下步骤：模板初始化：首先确定目标首帧所处位置，而后基于所提跟踪方法获得前n帧跟踪结果b×n并归一化，最后将其组合为模板集T＝[t1,t2,…,tn]∈R ；

模板动态更新：模板与跟踪结果相似性可表示为ψ＝[ψ1,ψ2,…,ψn]，设阈值为η，则跟踪结果与第u个模板相似性ψu表示为：式中，为第r帧跟踪结果，相似度值ψu越大表明跟踪结果与模板越相似。

设最大相似度为Λ，其表示为：

Λ＝maxψu (21)将最大相似度为Λ与阈值η比较，若最大相似度Λ＞η，表明本次跟踪结果与某目标模板相似度最大，则更新对应模板；反之，不做更新。