1.一种基于上下文渐进式三平面编码图像压缩算法,其特征在于,包括以下步骤:S1、采用MPEG算法对原始视频流进行压缩,并获取其编码为H265格式的可视图像;
S2、通过编码器和超编码器依次将可视图像X转换为潜在张量Y和超潜在张量Z,此外使用量子化的 、超解码器得到表示Y的平均值和标准差;
S3、通过概率计算模块使用平均值、标准差和已编码的三平面来评估值 ;
S4、设计一个基于上下文的速率降低模块,预测每个三平面的值并通过残差块和卷积层进行融合,最后使用激活函数确定 值;
S5、设计一个基于上下文的失真降低模块,在熵解码之后使用偏隐张量对任意范围内的值进行图像重构;
S6、最后,通过超解码器将改进的潜在张量进行图像重建;
所述S1包括以下步骤:
采用MPEG视频流图像压缩算法,通过运动补偿、离散余弦变换(DCT)和哈夫曼编码技术,提高高压缩比和低比特率下的视频质量;
所述S2包括以下步骤:
编码器通过提取图像中的关键特征,使用卷积神经网络层层递进的提取图像特征,最终输出潜在张量Y;超编码器进一步提炼和抽象化特征,进一步压缩信息等得到超潜在张量Z;
通过 计算得出量子化的超潜在张量 ,如公式(1)示,随后使用超解码器得到平均值M和标准差 ;
(1);
所述S3包括以下步骤:
通过概率计算模块使用平均值、标准差和已编码的三平面得到 ,其中,C代表通道数、H和W分别代表高度和宽度;
使用熵参数M和标准差 ,以及编码的三面值用以评估 ,其中熵参数通常用于调整和控制编码过程中的信息熵,从而影响压缩率的信息损失;
所述S4包括以下步骤:
通过设计一个基于上下文的速率降低模块,摒弃按照栅格扫描顺序预测潜在元素,而是预测每个平面的 , ;此外,速率降低模块对 中的概率估计进行细化,以产生更新的张量 , 在熵编码过程中需要的比特比 少,从而提高了“速率‑失真”RD的性能;
速率降低模块分别从输入 和上下文中提取特征,并通过残差块卷积层对它们进行融合,其中,融合张量具有与 相同的空间分辨率,但是通道是 的四倍,其按通道分为一个可加项 和一个标度项 ;
首先,S被转换为B,如公式(2)所示:
(2);
具体来说,其每个元素都在 中,然后将 添加到 中,并将其和通过B调制以产生更新的概率张量 ;
所述S5包括以下步骤:
设计一个基于上下文的失真降低模块,使用偏隐张量 ,对于任意 ,重构图像 ,因此,在解码 之后,失真降低模块使用上下文来减少误差,从而减少图像失真;
所述失真降低模块的体系结构以M和 为上下文,失真降低模块模块将偏移张量化为 ,如公式(3)示: (3);
失真降低模块经过训练,可以将损耗将至最低,如公式(4)所示: (4);
所述S6包括以下步骤:
通过超解码器将改进的潜在张量 进行图像重建得到 。
2.一种终端设备,其特征在于,包括:
处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;所述处理器执行所述程序或指令时实现如权利要求1所述的图像压缩算法。