利索能及
我要发布
收藏
专利号: 2017106069381
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于高斯极值滤波和群稀疏RPCA的运动目标检测方法,包括:

1)使用高斯极值滤波Gaussian max‑pooling对原始图像进行滤波处理;

2)使用Ncut对所有图像序列进行超像素分割;

3)对超像素区域进行合并得到图像分割结果;

4)对帧间同性区域进行连接,实现视频分割;

5)使用对其进行群约束,得到运动前景;

其特征在于,所述具体如下:

步骤1)固定相机,获取连续图像序列Img=(img1,img2…imgT);

步骤2)对图像序列中的每一幅图像使用Gaussian max‑pooling进行滤波,得到ImgP=(imgP1,imgP2…imgPT);

步骤3)使用Ncut对图像序列中的每一幅图像进行超像素分割ImgL=(imgL1,imgL2…imgLT);

步骤4)对超像素分割结果进行合并,得到图像分割结果ImgS=(imgs1,imgs2…imgsT);

步骤5)对帧间同性区域进行连接,实现视频分割C=C1∪C2∪…Cm;

步骤6)使用对其进行群约束 得到运动前景;

所述步骤2)中,待处理像素及其邻域像素灰度值

6 3 0 1 8

8 9 3 5 9

3 2 8 2 8

9 2 3 7 9

2 9 5 2 5

Gaussian max‑pooling步骤如下:输入:待处理图像序列Img=(img1,img2…imgT),方差σa.选取目标像素v及其为中心n×n窗口内的像素组成一个向量b.使用高斯分布分别计算每个像素在灰度值范围M=(0,1,…,255)上的条件概率其中,μ'∈Nv,u是均值;

c.使用最大后验概率为每个像素的像素值计算一个最优像素值,并使用最优像素值替代原有像素的像素值,公式如下:d.为图像中的每个像素都进行以上操作,直到像素处理完为止;

e.对图像序列中所有像素值进行a,b操作,得到新的图像序列ImgP=(imgP1,imgP2…imgPT);

所述步骤3)具体为:

输入:图像序列Img=(img1,img2…imgT);

使用Mori G.Guiding Model Search Using Segmentation[J].Proceedings,2005,2:

1417‑1423Vol.2.中方法对图像进行超像素分割,得到和图像大小的矩阵,矩阵中包含图像每个像素的标签值ImgL=(imgL1,imgL2…imgLT);

输出:ImgL=(imgL1,imgL2…imgLT);

所述步骤4)具体为:

输入:图像Img=(img1,img2…imgT),图像序列标签号ImgL=(imgL1,imgL2…imgLT);

使用Ma Y,Derksen H,Hong W,et al.Segmentation of Multivariate Mixed Data via Lossy Data Coding and Compression[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,2007,29(9):1546,对中子空间聚类方法对超像素区域进行合并,在合并的同时不断更新图像中像素的标签值,直到不能合并为止,得到最终结果图像分割结果ImgS=(imgs1,imgs2…imgsT);

输出:图像分割ImgS=(imgs1,imgs2…imgsT);

所述步骤5)具体为:

计算相邻两帧图像区域建立邻接图,计算前一帧区域中心(Xc,Yc)与后一帧区域中心(Xn,Yn)相差距离;

2 2 2 2

(Xc‑Xn) +(Yc‑Yn) ≤Dis ,如果距离小于Dis则认为是相邻区域,根据中心距离为图像序列ImgP=(imgP1,imgP2…imgPT)中每相邻两帧都建立一个相邻区域邻接图;

图像区域中心计算方法如下:

对一个区域中每个像素值的横坐标进行相加,再得到平均值对一个区域中每个像素值的纵坐标进行相加,再得到平均值得到每个区域的中心坐标;

从图像序列ImgP=(imgP1,imgP2…imgPT)中第一帧图像开始计算直到最后一帧,子空间聚类方法判断邻接图中区域是前一帧与后一帧区域是否相似,如果相似则更新区域标签,在计算的同时更新像素所属的标签值,得到图像序列所有像素的标签值C=C1∪C2∪…Cm,图像序列中具有相同属性的像素被分到了一个Cluster中。

2.如权利要求书1所述的方法,其特征在于,所述步骤6)具体为:使用群稀疏RPCA分解图像序列D,令D=ImgP,ImgP则是经过高斯极值滤波后的图像序列,

其中,||·||C(2,1)表示图像序列D中某一个Cluster的2,1范数;

[·]jk表示整个矩阵,(j,k)指的是第j行第k列的元素,|Ci|表示组Ci中像素的个数;为了求解A,E,使用拉格朗日乘子法求解;

其中Y为中间临时变量;

其中E求解步骤如下:

令 假设(j,k)∈Ci, a和b表示M中的第a行第b列,[.]ab表示矩阵中第a行第b列中的元素,[.]Ci表示第i个区域的所有元素;

求解A,E的步骤具体如下:

输入:D,视频分割结果C

输出:A,E

‑6

初始化:A=E=Y=0,μ=10当没有饱和时,不停迭代计算:固定其他参数,更新A,

固定其他参数,更新E,

更新Y,Y=Y+μ(D‑A‑E)更新μ,μ=ρμ,参数ρ控制了收敛速度;设置ρ为1.1结束,输出A,E。