1.一种视频时域单元分割方法,其特征在于包括如下步骤:在视频字幕中心位置提取水平时空切片;
根据提取水平时空切片计算每一视频帧的最小时空语义信息量MSSI;
检测视频的最小时空语义信息量MSSI的突变;
以最小时空语义信息量MSSI的突变为边界分割视频时域单元;
对于视频V(x,y,t),视频字幕中心位置的水平时空切片S可表示为:式中: 表示视频V中位置x=j,t=i,y取字幕高度中值处的像素,满足j∈[1,W],i∈[1,L],W表示视频帧的宽度,L表示视频的长度;
所述方法还包括对水平时空切片S进行预处理的步骤,方法如下:预处理采用自适应高斯混合背景模型进行,将水平时空切片S的每一列作为一个输入2
高斯模型,模型参数逐列更新;高斯均值μ和方差δ的更新公式为:上式中: 是时空切片S中第t+1列的亮度,α是修正率,定义为:上式中:Mn是匹配次数;
检测时空切片S的每一像素 是否服从N(μ,δ)分布,然后前景字幕将由以下公式计算得到:
根据公式(4),水平时空切片S上的字幕作为前景从背景中分离出来;视频V(x,y,t)中第i帧的最小时空语义信息量MSSI可由下式计算得式中:
τ用于量度单一像素最小时空语义信息量MSSI的大小, 低于τ的像素将被视为干扰而去除掉;
视频时域单元边界处会产生MSSI的突变,记突变量为Δ,则根据公式(5),Δ可由下式计算得到:
从公式(7)得出,Δ包含MSSI突然增大和突然变小两种情况,这两种情况都对应于视频时域单元的边界;将视频时域单元的边界B函数定义为:式中:w0表示当前字幕帧与其前一字幕帧的MSSI突变程度显著阈值;
按照公式(8)计算得到B函数曲线,曲线峰值对应于视频时域单元边界,按照B函数曲线即可完成视频时域单元分割。