买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种三维视频重定位方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种三维视频重定位方法

面议

专利号： 2015108234045

申请人：宁波大学

专利类型：发明专利

专利状态：已下证

更新日期：2024-12-10

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种三维视频重定位方法，其特征在于包括以下步骤：

①待处理的原始三维视频序列由彩色视频序列和深度视频序列构成，假定彩色视频序列中包含的彩色图像的总帧数和深度视频序列中包含的深度图像的总帧数均为T，将彩色视频序列中t时刻的彩色图像记为{It(x,y)}，将深度视频序列中t时刻的深度图像记为{Dt(x,y)}，其中，T>1，1≤t≤T，1≤x≤W,1≤y≤H，W表示彩色视频序列中的彩色图像和深度视频序列中的深度图像的宽度，H表示彩色视频序列中的彩色图像和深度视频序列中的深度图像的高度，It(x,y)表示{It(x,y)}中坐标位置为(x,y)的像素点的像素值，Dt(x,y)表示{Dt(x,y)}中坐标位置为(x,y)的像素点的像素值；

②对由T帧彩色图像构成并呈三维立方体的彩色视频序列在X方向上进行采样，得到彩色视频序列的W个Y-T截面图像，将彩色视频序列的第x个Y-T截面图像记为{Ix(y,t)}，将{Ix(y,t)}中坐标位置为(y,t)的像素点的像素值记为Ix(y,t)，Ix(y,t)＝It(x,y)；同样，对由T帧彩色图像构成并呈三维立方体的彩色视频序列在Y方向上进行采样，得到彩色视频序列的H个X-T截面图像，将彩色视频序列的第y个X-T截面图像记为{Iy(x,t)}，将{Iy(x,t)}中坐标位置为(x,t)的像素点的像素值记为Iy(x,t)，Iy(x,t)＝It(x,y)；

③通过对彩色视频序列的每个Y-T截面图像进行低秩矩阵分解，获取彩色视频序列的每个Y-T截面图像的最优垂直方向运动矩阵，将{Ix(y,t)}的最优垂直方向运动矩阵记为同样，通过对彩色视频序列的每个X-T截面图像进行低秩矩阵分解，获取彩色视频序列的每个X-T截面图像的最优水平方向运动矩阵，将{Iy(x,t)}的最优水平方向运动矩阵记为然后根据彩色视频序列的每个Y-T截面图像的最优垂直方向运动矩阵和每个X-T截面图像的最优水平方向运动矩阵，获取彩色视频序列中每个时刻的彩色图像的运动显著图，将{It(x,y)}的运动显著图记为{Mt(x,y)}，其中，Mt(x,y)表示{Mt(x,y)}中坐标位置为(x,y)的像素点的像素值；

④将彩色视频序列中当前待处理的t时刻的彩色图像定义为当前彩色图像，记为

{It(x,y)}；并将深度视频序列中与{It(x,y)}对应的深度图像定义为当前深度图像，记为{Dt(x,y)}，其中，此处t的初始值为2，2≤t≤T；

⑤提取{It(x,y)}的图像显著图、梯度能量图和运动显著图；然后对{It(x,y)}的

图像显著图、梯度能量图和运动显著图进行融合，得到{It(x,y)}的视觉注意力图，记为其中，表示中坐标位置为(x,y)的像素点的像素值；

⑥计算{It(x,y)}的帧内一致性能量图，记为将中坐标

位置为(x,y)的像素点的像素值，即{It(x,y)}中坐标位置为(x,y)的像素点的帧内一致性能量值记为*

其中，x表示坐标位置(x,y)的横坐标位置

或与坐标位置(x,y)水平相邻的横坐标位置，x∈{x-1,x,x+1}，如果x-1≥1，则It(x-1,y)表示{It(x,y)}中坐标位置为(x-1,y)的像素点的像素值，如果x-1<1，则令It(x-1,y)＝It(1,y)；如果x+1≤W，则It(x+1,y)表示{It(x,y)}中坐标位置为(x+1,y)的像素点的像素值，如果x+1>W，则令It(x+1,y)＝It(W,y)；当k＝x-1时如果k≥1且y-1≥1，则It(k,y-1)表示{It(x,y)}中坐标位置为(k,y-1)的像素点的像素值，当k＝x-1时如果k≥1且y-1<1，则令It(k,y-1)＝It(k,1)，当k＝x-1时如果k<1且y-1≥1，则令It(k,y-1)＝It(1,y-1)，当k＝x-1时如果k<1且y-1<1，则令It(k,y-1)＝It(1,1)；当k＝x时如果y-1≥1，则It(k,y-1)表示{It(x,y)}中坐标位置为(k,y-1)的像素点的像素值，当k＝x时如果y-1<1，则令It(k,y-1)＝It(k,1)；当k＝x+1时如果k≤W且y-1≥1，则It(k,y-1)表示{It(x,y)}中坐标位置为(k,y-1)的像素点的像素值，当k＝x+1时如果k≤W且y-1<1，则令It(k,y-1)＝It(k,1)，当k＝x+1时如果k>W且y-1≥1，则令It(k,y-1)＝It(W,y-1)，当k＝x+1时如果k>W且y-1<1，则令It(k,y-1)＝It(W,1)；当k＝x-1时It(k+1,y)表示{It(x,y)}中坐标位置为(k+1,y)的像素点的像素值，当k＝x时如果k+1≤W，则It(k+1,y)表示{It(x,y)}中坐标位置为(k+1,y)的像素点的像素值，当k＝x时如果k+1>W，则令It(k+1,y)＝It(W,y)；It(1,y)、It(W,y)、It(k,1)、It(1,y-1)、It(1,1)、It(W,y-1)、It(W,1)对应表示{It(x,y)}中坐标位置为(1,y)、(W,y)、(k,1)、(1,y-1)、(1,1)、(W,y-1)、(W,1)的像素点的像素值，符号“| |”为取绝对值符号；

⑦计算{It(x,y)}的帧间一致性能量图，记为将中坐标位置

为(x,y)的像素点的像素值，即{It(x,y)}中坐标位置为(x,y)的像素点的帧间一致性能量值记为其中，2×B+1表示{It(x,y)}中以坐标位置为(x+i,y+j)的像素点为中心的块的尺寸，St-1,i'(y)表示彩色视频序列中t-1时刻的彩色图像的第i'条垂直缝隙的纵坐标位置为y时的横坐标位置，ln( )为以自然基数e为底的对数函数，符号“| |”为取绝对值符号，如果x+i<1且y+j<1，则令E(x+i,y+j)＝E(1,1)，并令It(x+i,y+j)＝It(1,1)；如果x+i<1且1≤y+j≤H，则令E(x+i,y+j)＝E(1,y+j)，并令It(x+i,y+j)＝It(1,y+j)；

如果x+i<1且y+j>H，则令E(x+i,y+j)＝E(1,H)，并令It(x+i,y+j)＝It(1,H)；如果

1≤x+i≤W且y+j<1，则令E(x+i,y+j)＝E(x+i,1)，并令It(x+i,y+j)＝It(x+i,1)；

如果1≤x+i≤W且1≤y+j≤H，则It(x+i,y+j)表示{It(x,y)}中坐标位置为(x+i,y+j)的像素点的像素值；如果1≤x+i≤W且y+j>H，则令E(x+i,y+j)＝E(x+i,H)，并令It(x+i,y+j)＝It(x+i,H)；如果x+i>W且y+j<1，则令E(x+i,y+j)＝E(W,1)，并令It(x+i,y+j)＝It(W,1)；如果x+i>W且1≤y+j≤H，则令E(x+i,y+j)＝E(W,y+j)，并令It(x+i,y+j)＝It(W,y+j)；如果x+i>W且y+j>H，则令E(x+i,y+j)＝E(W,H)，并令It(x+i,y+j)＝ It(W,H)；如果St-1,i'(y)+i<1 且y+j<1，则令It-1(St-1,i'(y)+i,y+j)＝It-1(1,1)；如果 St-1,i'(y)+i<1 且 1 ≤ y+j ≤ H，则令 It-1(St-1,i'(y)+i,y+j) ＝It-1(1,y+j)；如果 St-1,i'(y)+i<1且y+j>H，则令 It-1(St-1,i'(y)+i,y+j)＝It-1(1,H)；如果1≤St-1,i'(y)+i ≤ W 且y+j<1，则令 It-1(St-1,i'(y)+i,y+j) ＝ It-1(St-1,i'(y)+i,1)；

如果1≤St-1,i'(y)+i≤W且1≤y+j≤H，则It-1(St-1,i'(y)+i,y+j)表示彩色视频序列中t-1时刻的彩色图像中坐标位置为(St-1,i'(y)+i,y+j)的像素点的像素值；如果

1≤St-1,i'(y)+i≤W且y+j>H，则令It-1(St-1,i'(y)+i,y+j)＝It-1(St-1,i'(y)+i,H)；如果St-1,i'(y)+i>W且y+j<1，则令It-1(St-1,i'(y)+i,y+j)＝It-1(W,1)；如果St-1,i'(y)+i>W且

1≤y+j≤H，则令It-1(St-1,i'(y)+i,y+j)＝It-1(W,y+j)；如果St-1,i'(y)+i>W且y+j>H，则令It-1(St-1,i'(y)+i,y+j)＝It-1(W,H)；上述It(1,1)、It(1,y+j)、It(1,W)、It(x+i,1)、It(x+i,H)、It(W,1)，It(W,y+j)、It(W,H)对应表示{It(x,y)}中坐标位置为(1,1)、(1,y+j)、(1,W)、(x+i,1)、(x+i,H)、(W,1)、(W,y+j)、(W,H)的像素点的像素值，上述It-1(1,1)、It-1(1,y+j)、It-1(1,W)、It-1(x+i,1)、It-1(x+i,H)、It-1(W,1)、It-1(W,y+j)、It-1(W,H)对应表示彩色视频序列中t-1时刻的彩色图像中坐标位置为(1,1)、(1,y+j)、(1,W)、(x+i,1)、(x+i,H)、(W,1)、(W,y+j)、(W,H)的像素点的像素值；

⑧根据和计算{It(x,y)}的总能量图，

记为将中坐标位置为(x,y)的像素点的像素值记为

其中，α2、

β2和γ2为加权参数；

⑨将重定位彩色图像和重定位深度图像的宽度记为W'，将{It(x,y)}和{Dt(x,y)}的垂直缝隙的条数记为Ns，Ns＝W-W'，其中，W'

⑩根据通过动态规划方法找出{It(x,y)}的Ns条垂直缝隙，将

{It(x,y)}的第i'条垂直缝隙记为{St,i'(y)|1≤y≤H}，其中，1≤i'≤Ns，St,i'(y)表示{St,i'(y)|1≤y≤H}在纵坐标位置为y时的横坐标位置；

将{It(x,y)}中所有落在{It(x,y)}的Ns条垂直缝隙内的像素点删除，得到重定位彩色图像，记为将{Dt(x,y)}中所有落在相同的Ns条垂直缝隙内的像素点删除，

得到重定位深度图像，记为其中，1≤x1≤W'，表示中坐标位

置为(x1,y)的像素点的像素值，表示中坐标位置为(x1,y)的像素点的像

素值；

令t＝t+1；然后将彩色视频序列中t时刻的彩色图像作为当前彩色图像，记为

{It(x,y)}；并将深度视频序列中与{It(x,y)}对应的深度图像作为当前深度图像，记为{Dt(x,y)}；再返回步骤⑤继续执行，直至三维视频序列中的所有彩色图像和深度图像处理完毕，得到三维视频序列中的每帧彩色图像对应的重定位彩色图像、三维视频序列中的每帧深度图像对应的重定位深度图像；其中，t＝t+1中的“＝”为赋值符号。

2.根据权利要求1所述的一种三维视频重定位方法，其特征在于所述的步骤③中的的获取过程为：

③-a1、对{Ix(y,t)}进行低秩矩阵分解，得到{Ix(y,t)}的所有垂直方向背景矩阵和所有垂直方向运动矩阵；

③-a2、利用最小化概率密度函数，获取{Ix(y,t)}的最优垂直方向背景

矩阵和最优垂直方向运动矩阵将和的组合记为

其中，Sx为{Ix(y,t)}的矩阵形式表示，Sx＝Bx+Mx，Sx、

Bx和Mx的维数均为H×T，argmin[ ]为最小化概率密度函数，表示

取使得的值最小时的(Bx,Mx)，Ωx表示{Ix(y,t)}的所有垂直方向背景矩

阵和所有垂直方向运动矩阵的组合(Bx,Mx)的集合，(Bx,Mx)∈Ωx，Bx指{Ix(y,t)}的垂直方向背景矩阵，Mx指{Ix(y,t)}的垂直方向运动矩阵，符号“|| ||*”为求取矩阵核的范数符号，符号“|| ||1”为求取矩阵的1-范数符号，λ为拉格朗日乘子，s.t.表示“受约束于”；

所述的步骤③中的的获取过程为：

③-b1、对{Iy(x,t)}进行低秩矩阵分解，得到{Iy(x,t)}的所有水平方向背景矩阵和所有水平方向运动矩阵；

③-b2、利用最小化概率密度函数，获取{Iy(x,t)}的最优水平方向背景

矩阵和最优水平方向运动矩阵将和的组合记为

其中，Sy为{Iy(x,t)}的矩阵形式表示，Sy＝By+My，

Sy、By和My的维数均为W×T，表示取使得的值最

小时的(By,My)，Ωy表示{Iy(x,t)}的所有水平方向背景矩阵和所有水平方向运动矩阵的组合(By,My)的集合，(By,My)∈Ωy，By指{Iy(x,t)}的水平方向背景矩阵，My指{Iy(x,t)}的水平方向运动矩阵。

3.根据权利要求1或2所述的一种三维视频重定位方法，其特征在于所述的步骤③中的{Mt(x,y)}的获取过程为：③-c1、将彩色视频序列的W个Y-T截面图像各自的最优垂直方向运动矩阵在X方向上进行叠加，构造得到Y-T截面图像的立方体，记为ScubeYT，其中，ScubeYT的维数为W×H×T；

同样，将彩色视频序列的H个X-T截面图像各自的最优水平方向运动矩阵在Y方向上进行叠加，构造得到X-T截面图像的立方体，记为ScubeXT，其中，ScubeXT的维数为W×H×T；

③-c2、计算norm(ScubeXT·*ScubeYT)，然后将计算结果作为彩色视频序列的初步的运动显著序列，其中，norm( )表示归一化操作函数，norm(ScubeXT·*ScubeYT)中的符号“·*”为矩阵点乘符号；

③-c3、采用高斯滤波器对呈三维立方体的彩色视频序列的初步的运动显著序列中t时刻的X-Y截面图像进行平滑操作，得到{It(x,y)}的运动显著图{Mt(x,y)}，Mt(x,y)＝M't(x,y)*Gσ(x,y)，其中，M't(x,y)表示彩色视频序列的初步的运动显著序列中t时刻的X-Y截面图像，“*”为卷积操作符号，Gσ(x,y)表示标准差为σ的高斯函数中位置为(x,y)处的元素的值， exp( )为以自然基数e为底的指数函数。

4.根据权利要求3所述的一种三维视频重定位方法，其特征在于所述的步骤⑤中的{It(x,y)}的图像显著图的获取过程为：利用基于图论的视觉显著模型提取出{It(x,y)}的图像显著图，记为{St(x,y)}，其中，St(x,y)表示{St(x,y)}中坐标位置为(x,y)的像素点的像素值；

所述的步骤⑤中的{It(x,y)}的梯度能量图的获取过程为：采用Sobel算子对

{It(x,y)}进行卷积，得到{It(x,y)}中的每个像素点的水平方向梯度和垂直方向梯度，将{It(x,y)}中坐标位置为(x,y)的像素点的水平方向梯度记为将{It(x,y)}中坐标位置为(x,y)的像素点的垂直方向梯度记为然后根据{It(x,y)}中

的所有像素点各自的水平方向梯度和垂直方向梯度，计算{It(x,y)}的梯度能量图，记为{Gt(x,y)}，将{Gt(x,y)}中坐标位置为(x,y)的像素点的像素值记为Gt(x,y)，

5.根据权利要求4所述的一种三维视频重定位方法，其特征在于所述的步骤⑤中的其中，α1、β1和γ1为加权参数。

6.根据权利要求5所述的一种三维视频重定位方法，其特征在于所述的步骤⑩的具体过程为：

⑩-1、根据计算{It(x,y)}中的每个像素点的累计能量值，将{It(x,y)}中坐

标位置为(x,y)的像素点的累计能量值记为其中，min( )

为取最小值函数；

⑩-2、根据{It(x,y)}中的每个像素点的累计能量值，采用动态规划方法找出

{It(x,y)}中从y＝1到y＝H的Ns条成本最小的路径，将每条成本最小的路径作为

{It(x,y)}的一条垂直缝隙。