买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于多域感知特征融合的视频编码方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于多域感知特征融合的视频编码方法

￥22800

专利号： 2025109522166

申请人：石家庄铁道大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-12-30

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于多域感知特征融合的视频编码方法，其特征在于，包括以下步骤：S1：对输入视频帧序列进行多域感知特征提取，所述多域感知特征包括空间域感知特征、时间域感知特征和频率域感知特征，具体提取方法如下：空间域感知特征提取：针对每个编码单元，计算其覆盖像素点的边缘强度、对比度和空间掩蔽性特征，并加权融合为空间域综合感知特征；

时间域感知特征提取：针对每个编码单元，基于其覆盖像素点，提取反映帧间运动显著性的亮度变化特征，作为该编码单元的时间域感知特征；

频率域感知特征提取：针对每个编码单元，对其覆盖像素点进行傅里叶变换，并通过带通滤波提取人眼敏感的中频成分，计算该中频成分对应区域的均值，作为该编码单元的频率域感知特征；

S2：对S1提取的多域感知特征分别进行归一化处理，并设计基于特征值动态自适应调整的融合权重机制，通过加权聚合生成每个编码单元的感知重要性因子，具体包括：特征归一化：采用Min‑Max方法将所有特征映射至[0,1]区间，消除量纲差异对特征表征的影响；

动态融合权重：计算随空间域、时间域、频率域感知特征自适应调整的权重，强化关键感知特征的影响，并通过Sigmoid函数实现权重的动态调整；

所述动态融合权重通过Sigmoid函数自适应调整计算公式包括：空间域权重计算公式为：，

时间域权重计算公式为：，

频率域权重计算公式为：，

默认参数为， , ；

分别为归一化后的空间域感知特征、时间域感知特征和频率域感知特征；

感知重要性因子计算：将归一化后的多域感知特征与所述动态融合权重进行加权求和，最终得到编码单元的感知重要性因子，具体计算公式为：，

其中分别为空间域权重、时间域权重和频率域权重，分别为归一化后的空间域感知特征、时间域感知特征和频率域感知特征；

S3：基于所述感知重要性因子构建感知失真评估值，并将视频编码标准方法中的率失真目标函数替换为，用于指导编码单元的码率分配，包括编码单元的比特资源分配及量化参数迭代优化；其中为视频编码标准方法中的失真项，为拉格朗日乘子，为编码所使用的码率；

S4：根据S2计算得到的感知重要性因子，通过非线性映射函数计算每个编码单元的量化参数调整量；将视频编码标准方法中预设的基础量化参数值与量化参数调整量相加，得到该编码单元的最终量化参数值，用于视频编码，实现自适应率失真优化；所述非线性映射采用双曲正切函数实现量化参数调整量的非线性变换。

2.如权利要求1所述的基于多域感知特征融合的视频编码方法，其特征在于，所述空间域感知特征提取包括：通过Sobel算子计算像素梯度幅值；基于3×3邻域计算亮度标准差；

以四邻域预测误差作为空间掩蔽值，累加像素级特征后取均值得到每个编码单元的边缘、对比度和空间掩蔽性特征，并按0.4:0.3:0.3权重融合为空间域综合感知特征。

3.如权利要求1所述的基于多域感知特征融合的视频编码方法，其特征在于，所述时间域感知特征提取为：计算当前帧与前一帧对应位置的亮度绝对差异，取每个编码单元覆盖像素的差值均值作为时间域感知特征，首帧时间域感知特征置为0。

4.如权利要求1所述的基于多域感知特征融合的视频编码方法，其特征在于，所述频率域感知特征提取包括：对当前帧进行傅里叶变换得到频谱图，利用内半径为10、外半径为60的环形带通滤波器滤除低频和高频成分，保留中频成分；再通过逆傅里叶变换获得中频特征图，并计算每个编码单元所覆盖区域对应的中频特征图像素均值，作为该编码单元的频率域感知特征。

5.如权利要求1所述的基于多域感知特征融合的视频编码方法，其特征在于，所述特征归一化采用Min‑Max方法，公式为：，

其中为编码单元的空间域感知特征或时间域感知特征或频率域感知特征，为归一化后的特征值。

6.如权利要求1所述的基于多域感知特征融合的视频编码方法，其特征在于，所述视频编码标准方法为AVC，HEVC，VVC视频编码标准。

7.如权利要求1所述的基于多域感知特征融合的视频编码方法，其特征在于，所述感知失真评估值通过计算；其中为视频编码标准方法中的失真项，为编码单元的感知重要性因子，为默认取值为0.5的预设加权系数。

8.如权利要求1所述的基于多域感知特征融合的视频编码方法，其特征在于，所述量化参数调整量通过双曲正切函数映射计算：，

其中，默认参数为，即裁剪函数，用于将计算结果限定在[‑

5,5]区间内，为编码单元的感知重要性因子；

最终值为：

，

其中为编码器的基础量化参数，且。