相比于高效视频编码(high efficiency video coding,HEVC)标准,新一代编码标准多功能视频编码(versatile video coding,VVC)引入了很多新的技术,其中包括四叉树(quadtree,QT)和多类型树(multi-type tree,MTT)划分,MTT划分由HEVC中的QT...相比于高效视频编码(high efficiency video coding,HEVC)标准,新一代编码标准多功能视频编码(versatile video coding,VVC)引入了很多新的技术,其中包括四叉树(quadtree,QT)和多类型树(multi-type tree,MTT)划分,MTT划分由HEVC中的QT划分延伸而来。新划分方法提高了压缩效率,但导致编码时间急剧增加。为了降低编码复杂度,提出了一种结合深度学习方法和MTT方向早期判决的快速帧内编码算法。首先使用轻量级的卷积神经网络(convolutional neural network,CNN)对QT和部分MTT进行预测划分,其余MTT则采用提前预测MTT划分方向的方法作进一步的优化。实验结果表明,所提方法能够大幅降低编码复杂度,相比于原始编码器的编码时间减少了74.3%,且只有3.3%的码率损失,性能优于对比的方法。展开更多
多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式...多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式从35种扩展到67种,导致编码复杂度急剧上升。为降低VVC的帧内编码复杂度,首先,提出了一种基于图神经网络的帧内编码单元(coding unit,CU)划分快速算法,该算法利用高效的图神经网络模型直接预测CU的最优划分模式,从而跳过冗余的CU划分遍历。其次,提出了一种基于空间相关性和纹理特征的帧内模式选择快速算法,该算法利用平均方向方差和Sobel梯度算子确定纹理方向,并跳过部分角度预测模式,同时结合预测模式间的相关性精简率失真模式列表。实验结果表明,该算法能够在BDBR(bjontegaard delta bit rate)上升2.29%的代价下,节省64.04%的编码时间。展开更多
通用视频编码(versatile video coding,VVC)采用多种高级编码工具共同实现卓越的编码性能。与高效视频编码(high efficient video coding,HEVC)相比,VVC的变换系数分布(transform coefficient distribution,TCD)具有更尖锐的峰值。针对...通用视频编码(versatile video coding,VVC)采用多种高级编码工具共同实现卓越的编码性能。与高效视频编码(high efficient video coding,HEVC)相比,VVC的变换系数分布(transform coefficient distribution,TCD)具有更尖锐的峰值。针对这一现象,对帧级TCD进行概率密度函数(probability density function,PDF)建模,并提出一种基于统计建模的帧级编码失真预测模型,将帧级失真建模为TCD分布参数和量化参数的函数。实验结果表明,相比于拉普拉斯分布以及柯西分布,广义高斯分布在TCD概率密度拟合方面表现最佳;基于广义高斯分布的失真预测模型的预测结果最接近实际编码失真。展开更多
通用视频编码(versatile video coding,VVC)标准由联合视频专家组共同制定,它遵循基于混合块的编解码器及其前身高效视频编码(high efficient video coding,HEVC)的传统架构。与HEVC相比,VVC的帧内预测功能包含大量修改,编码效率大大提...通用视频编码(versatile video coding,VVC)标准由联合视频专家组共同制定,它遵循基于混合块的编解码器及其前身高效视频编码(high efficient video coding,HEVC)的传统架构。与HEVC相比,VVC的帧内预测功能包含大量修改,编码效率大大提高。在VVC的基础上,提出了一种改进的基于亮度残差的帧内编码算法,通过减少率失真代价的检查次数,在保证编码质量不受较大影响的前提下,降低了计算复杂性,并提高了VVC的帧内编码效率。实验结果表明,在VTM16.0的VVC软件版本下,在相同配置下,改进算法的编码时间可以减少27.03%,而Bj?ntegaard-Delta rate只增加了0.9%。展开更多
文摘相比于高效视频编码(high efficiency video coding,HEVC)标准,新一代编码标准多功能视频编码(versatile video coding,VVC)引入了很多新的技术,其中包括四叉树(quadtree,QT)和多类型树(multi-type tree,MTT)划分,MTT划分由HEVC中的QT划分延伸而来。新划分方法提高了压缩效率,但导致编码时间急剧增加。为了降低编码复杂度,提出了一种结合深度学习方法和MTT方向早期判决的快速帧内编码算法。首先使用轻量级的卷积神经网络(convolutional neural network,CNN)对QT和部分MTT进行预测划分,其余MTT则采用提前预测MTT划分方向的方法作进一步的优化。实验结果表明,所提方法能够大幅降低编码复杂度,相比于原始编码器的编码时间减少了74.3%,且只有3.3%的码率损失,性能优于对比的方法。
文摘多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式从35种扩展到67种,导致编码复杂度急剧上升。为降低VVC的帧内编码复杂度,首先,提出了一种基于图神经网络的帧内编码单元(coding unit,CU)划分快速算法,该算法利用高效的图神经网络模型直接预测CU的最优划分模式,从而跳过冗余的CU划分遍历。其次,提出了一种基于空间相关性和纹理特征的帧内模式选择快速算法,该算法利用平均方向方差和Sobel梯度算子确定纹理方向,并跳过部分角度预测模式,同时结合预测模式间的相关性精简率失真模式列表。实验结果表明,该算法能够在BDBR(bjontegaard delta bit rate)上升2.29%的代价下,节省64.04%的编码时间。
文摘通用视频编码(versatile video coding,VVC)采用多种高级编码工具共同实现卓越的编码性能。与高效视频编码(high efficient video coding,HEVC)相比,VVC的变换系数分布(transform coefficient distribution,TCD)具有更尖锐的峰值。针对这一现象,对帧级TCD进行概率密度函数(probability density function,PDF)建模,并提出一种基于统计建模的帧级编码失真预测模型,将帧级失真建模为TCD分布参数和量化参数的函数。实验结果表明,相比于拉普拉斯分布以及柯西分布,广义高斯分布在TCD概率密度拟合方面表现最佳;基于广义高斯分布的失真预测模型的预测结果最接近实际编码失真。
文摘通用视频编码(versatile video coding,VVC)标准由联合视频专家组共同制定,它遵循基于混合块的编解码器及其前身高效视频编码(high efficient video coding,HEVC)的传统架构。与HEVC相比,VVC的帧内预测功能包含大量修改,编码效率大大提高。在VVC的基础上,提出了一种改进的基于亮度残差的帧内编码算法,通过减少率失真代价的检查次数,在保证编码质量不受较大影响的前提下,降低了计算复杂性,并提高了VVC的帧内编码效率。实验结果表明,在VTM16.0的VVC软件版本下,在相同配置下,改进算法的编码时间可以减少27.03%,而Bj?ntegaard-Delta rate只增加了0.9%。