利索能及-专利交易平台_专利购买_专利出售-买专利,卖专利上利索能及

欢迎来到利索能及~ 联系电话：18621327849

查出售查求购

我要发布

专利交易专利求购

一种基于参考块的VVC帧间快速编码方法

￥21000

专利号： 2023102991864

申请人：重庆邮电大学

专利类型：发明专利

专利状态：授权未缴费

专利领域：电通信技术

更新日期：2024-10-29

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于参考块的VVC帧间快速编码方法，其特征在于，包括：

S1：获取当前编码单元信息，其中编码单元信息包括当前编码单元的深度以及模式信息；

S2：根据当前编码信息确定是否进行网络预测划分，若进行网络预测划分，则执行步骤S3，若不进行网络预测划分，则执行编码器原始的划分过程；

S3：构建划分概率网络模型，并对划分概率网络模型进行训练；

S4：将当前编码单元输入到训练后的划分概率网络模型中，得到当前编码单元的划分概率预测值；

S5：根据划分概率预测值选取预测模式，确定该预测模式是否为划分模式，若为划分模式则返回S4，若不为划分模式则执行S6；

S6：采用当前编码单元CU对待编码的视频进行MergeSkip模式编码，并计算MergeSkip模式编码的RDCost值；

S7：根据RDCost值确定是否采用Skip模式跳过编码预测，否则遍历所有默认候选预测模式。

2.根据权利要求1所述的一种基于参考块的VVC帧间快速编码方法，其特征在于，对划分概率网络模型进行训练的过程包括：划分概率网络模型由分块卷积层、条件残差模块、子网络结构以及全连接层构成；训练划分概率网络模型的过程包括：步骤1：获取所有的编码单元，对CU的类型进行筛选，将筛选后的CU类型进行集合，得到训练数据集；

步骤2：对训练数据集中冗余的CU类型进行优化；

步骤3：将优化后的训练数据集输入到划分概率网络模型的分块卷积层中，学习原始数据、参考数据以及同位数据的不同特征；

步骤4：将学习的特征输入到条件残差模块中进行深层次特征提取；

步骤5：将提取的深层特征输入到子网络结构中，得到不同数据的划分结果；

步骤6：将划分结果输入到全连接层中，得到划分概率预测值；

步骤7：根据划分概率预测值计算模型的损失函数，不断调整模型的参数，当损失函数最小时，完成模型的训练。

3.根据权利要求2所述的一种基于参考块的VVC帧间快速编码方法，其特征在于，对CU的类型进行筛选的过程包括：获取所有的CU类型，确定各个类型CU的宽W、高H以及宽高的比率τ；根据CU的宽W、高H以及宽高的比率τ设置筛选条件，根据筛选条件对CU的类型进行筛选；其中筛选条件包括CU的宽和高的任意一边大于16，且当有一边为16或32时另一边不能为128；或者min(W,H)＝8且τ＝{4,8}的CU。

4.根据权利要求2所述的一种基于参考块的VVC帧间快速编码方法，其特征在于，对数据集中冗余的CU类型进行优化包括：数据集中的CU类型包括不划分NS、四叉划分QT、水平二叉划分BH、垂直二叉划分BV、水平三叉划分TH和垂直三叉划分TV；将水平二叉划分BH和水平三叉划分TH进行融合，得到水平划分HS，将垂直二叉划分BV和垂直三叉划分TV进行融合，得到垂直划分VS；优化后的划分类型包括NS、QT、HS以及VS。

5.根据权利要求2所述的一种基于参考块的VVC帧间快速编码方法，其特征在于，子网络结构对输入数据进行处理的过程包括：子网络结构的输入通道类型为(BATCH_SIZE,16,H，W)，其中子网络结构由卷积层和全连接层组成，且每个子网络的第一层卷积网络层卷积核的大小与步长分别为(4*τ，4*τ)、(4*τ，4*τ)，用于对输出的特征形状作规范化处理；对子网络进行训练过程中，通过增加额外的编码信息对网络进行训练；其中，额外的编码信息包括：量化参数QP、划分深度Depth、时域层Id和编码产生的RDCost；

对于min(W,H)＝8的子网络，其由两个卷积层组成，第二个卷积层的卷积核大小与步长分别为(2，2)、(2，2)；卷积层输出维度为(BATCH_SIZE,32,1,1)，对输出数据进行扁平化处理，得到(BATCH_SIZE,32)维度的数据；

对于min(W,H)＝16的子网络，其由三层卷积层组成，第二和第三层的卷积核大小与步长均为(2，2)、(2，2)；卷积层输出维度为(BATCH_SIZE,64,1,1)，对输出数据进行扁平化处理，得到(BATCH_SIZE,64)维度的数据；

对于min(W,H)＝32的子网络，其由三层卷积层组成，min(W,H)＝32的子网络在卷积第二和第三层的卷积核大小与步长分别为(4，4)、(4，4)；该子网络卷积层输出的维度为(BATCH_SIZE,128,1,1)；对输出数据进行扁平化处理，得到(BATCH_SIZE,128)维度的数据；

min(W,H)＝64的子网络，其由三层卷积层组成，该子网络在卷积第二和第三层的卷积核大小与步长分别为(2，2)、(2，2)，该子网络卷积层输出的维度为(BATCH_SIZE,32,2,2)；

对输出数据进行扁平化处理，得到(BATCH_SIZE,128)维度的数据。

6.根据权利要求2所述的一种基于参考块的VVC帧间快速编码方法，其特征在于，全连接层对划分结果进行处理的过程包括：划分结果为根据不同子网络得到的(BATCH_SIZE,

32)维度数据、(BATCH_SIZE,64)维度数据以及(BATCH_SIZE,128)维度数据；将得到的维度数据添加对应的编码信息，并作为全连接层的输入，得到当前CU类型的划分概率预测值。

7.根据权利要求2所述的一种基于参考块的VVC帧间快速编码方法，其特征在于，划分概率网络模型在进行训练时的损失函数为：其中，pm表示该类型CU中划分模式m的比例；α表示一个可变的用于调整划分模式惩罚度的一个参数；m表示划分模式；M表示所有划分模式的集和，yn,m表示CU的真实划分标签；

表示CU的预测标签；N表示预测类别数量；n表示N个类别中的第n个类别。

8.根据权利要求1所述的一种基于参考块的VVC帧间快速编码方法，其特征在于，根据划分概率预测值确定划分模式的过程包括：将划分概率预测值输入到softmax函数中，将各个类别预测的值转换成0到1之间的概率值，其中最大的概率值与设定的阈值区间[τ1,τ2]比较，当最大概率值小于阈值区间中的τ1时，采用编码器默认划分模式对CU进行划分，当最大概率值大于阈值区间中的τ2时，采用预测的编码模式对CU进行划分，否则采用优化模式对于CU进行划分。

9.根据权利要求8所述的一种基于参考块的VVC帧间快速编码方法，其特征在于，对CU进行划分的过程包括：采用编码器默认划分模式对CU进行划分包括：编码器默认对一个CU进行划分，其中最大划分数量为5个，包括四叉划分QT、垂直二叉划分BV、水平二叉划分BH、垂直三叉划分TV以及水平三叉划分TH；

采用预测的编码模式对CU进行划分包括：对划分模式栈进行清空；根据网络预测的划分模式对数据进行划分，其中网络预测的划分模式包括不划分NS、四叉划分QT、水平划分HS、垂直划分VS；

采用优化模式对于CU进行划分的过程包括：对划分模式栈进行清空，确定当前的划分模式，若当前划分模式为水平划分HS，则再次对划分后的CU进行水平二叉划分和水平三叉划分，若当前划分模式为垂直划分VS，则再次对划分后的CU进行垂直而二叉划分和垂直三叉划分，若当前划分模式均不为水平划分HS和垂直划分VS，则采用预测的编码模式对CU进行划分。