相比于高效视频编码(high efficiency video coding,HEVC)标准,新一代编码标准多功能视频编码(versatile video coding,VVC)引入了很多新的技术,其中包括四叉树(quadtree,QT)和多类型树(multi-type tree,MTT)划分,MTT划分由HEVC中的QT...相比于高效视频编码(high efficiency video coding,HEVC)标准,新一代编码标准多功能视频编码(versatile video coding,VVC)引入了很多新的技术,其中包括四叉树(quadtree,QT)和多类型树(multi-type tree,MTT)划分,MTT划分由HEVC中的QT划分延伸而来。新划分方法提高了压缩效率,但导致编码时间急剧增加。为了降低编码复杂度,提出了一种结合深度学习方法和MTT方向早期判决的快速帧内编码算法。首先使用轻量级的卷积神经网络(convolutional neural network,CNN)对QT和部分MTT进行预测划分,其余MTT则采用提前预测MTT划分方向的方法作进一步的优化。实验结果表明,所提方法能够大幅降低编码复杂度,相比于原始编码器的编码时间减少了74.3%,且只有3.3%的码率损失,性能优于对比的方法。展开更多
多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式...多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式从35种扩展到67种,导致编码复杂度急剧上升。为降低VVC的帧内编码复杂度,首先,提出了一种基于图神经网络的帧内编码单元(coding unit,CU)划分快速算法,该算法利用高效的图神经网络模型直接预测CU的最优划分模式,从而跳过冗余的CU划分遍历。其次,提出了一种基于空间相关性和纹理特征的帧内模式选择快速算法,该算法利用平均方向方差和Sobel梯度算子确定纹理方向,并跳过部分角度预测模式,同时结合预测模式间的相关性精简率失真模式列表。实验结果表明,该算法能够在BDBR(bjontegaard delta bit rate)上升2.29%的代价下,节省64.04%的编码时间。展开更多
新一代的三维视频编码标准——3D-HEVC (3D High Efficient Video Coding)为了显著减少视点个数,增加了包含视频场景几何信息的深度图像,但深度图像编码的计算复杂度非常高,其编码时间是彩色图像的4倍左右。为了降低深度图像编码的计算...新一代的三维视频编码标准——3D-HEVC (3D High Efficient Video Coding)为了显著减少视点个数,增加了包含视频场景几何信息的深度图像,但深度图像编码的计算复杂度非常高,其编码时间是彩色图像的4倍左右。为了降低深度图像编码的计算复杂度,文中提出了一种基于纹理特征分析的深度图像帧内编码单元(CU)快速划分算法。首先,对深度图像的编码树单元(CTU)进行初级纹理特征分析,根据深度图像的纹理变化特征,在大津法的基础上对全局灰度进行分级,再通过判断CTU内采样点的纹理复杂度以及纹理方向标识来确定当前CTU的划分趋势。然后,对纹理复杂度高的CTU进行CU级别的精细纹理特征分析,利用CU内部像素分布的统计特征,自底向上计算不同尺寸的CU的纹理划分标识。最后,根据CTU的纹理复杂度、纹理方向标识以及CU的纹理划分标识预测当前CTU的划分深度范围,并判断是否提前终止CU划分。实验结果表明,与3D-HEVC参考模型中的原始算法相比,所提算法在平均增加0.8%左右码率的同时,能够降低45%左右的编码时间,同时保持了良好的编码率失真性能;与现有的3种快速算法相比,所提算法在整体序列上分别降低了约12%,3%,4%的编码时间,而在大分辨率序列上则分别降低了14%,11%,10%的编码时间,并具有相近的编码率失真性能。展开更多
针对AVS(Audio Video Coding Standard,音视频编码标准)视频部分帧内预测中固定三抽头滤波器难以适应纹理类型变化、预测精度低的问题,基于相邻一维数据块(像素行或者像素列)之间纹理一致性更强的特点,提出了基于一维数据块的帧内自适...针对AVS(Audio Video Coding Standard,音视频编码标准)视频部分帧内预测中固定三抽头滤波器难以适应纹理类型变化、预测精度低的问题,基于相邻一维数据块(像素行或者像素列)之间纹理一致性更强的特点,提出了基于一维数据块的帧内自适应滤波编码算法,将固定三抽头滤波器扩展为自适应滤波器,以一维数据块为单位生成预测,解决参考像素与预测像素之间距离较远所带来的相关性差、预测不准确的问题。利用最小二乘方法,对已编码的相邻一维数据块进行自适应滤波预测,计算得到最优的三抽头滤波器,将其直接作为当前一维数据块的自适应滤波器,从而避免了自适应滤波器系数的传输开销。实验结果表明:新的帧内编码方法能够提高现有AVS视频帧内编码效率平均达到0.324 dB,最高达到0.879 dB,而且编码性能高于帧内模板匹配方法平均0.120 dB。所提出的方法在新一代的视频编码标准AVS2.0的制定中具有广阔的应用前景。展开更多
文摘相比于高效视频编码(high efficiency video coding,HEVC)标准,新一代编码标准多功能视频编码(versatile video coding,VVC)引入了很多新的技术,其中包括四叉树(quadtree,QT)和多类型树(multi-type tree,MTT)划分,MTT划分由HEVC中的QT划分延伸而来。新划分方法提高了压缩效率,但导致编码时间急剧增加。为了降低编码复杂度,提出了一种结合深度学习方法和MTT方向早期判决的快速帧内编码算法。首先使用轻量级的卷积神经网络(convolutional neural network,CNN)对QT和部分MTT进行预测划分,其余MTT则采用提前预测MTT划分方向的方法作进一步的优化。实验结果表明,所提方法能够大幅降低编码复杂度,相比于原始编码器的编码时间减少了74.3%,且只有3.3%的码率损失,性能优于对比的方法。
文摘多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式从35种扩展到67种,导致编码复杂度急剧上升。为降低VVC的帧内编码复杂度,首先,提出了一种基于图神经网络的帧内编码单元(coding unit,CU)划分快速算法,该算法利用高效的图神经网络模型直接预测CU的最优划分模式,从而跳过冗余的CU划分遍历。其次,提出了一种基于空间相关性和纹理特征的帧内模式选择快速算法,该算法利用平均方向方差和Sobel梯度算子确定纹理方向,并跳过部分角度预测模式,同时结合预测模式间的相关性精简率失真模式列表。实验结果表明,该算法能够在BDBR(bjontegaard delta bit rate)上升2.29%的代价下,节省64.04%的编码时间。
文摘新一代的三维视频编码标准——3D-HEVC (3D High Efficient Video Coding)为了显著减少视点个数,增加了包含视频场景几何信息的深度图像,但深度图像编码的计算复杂度非常高,其编码时间是彩色图像的4倍左右。为了降低深度图像编码的计算复杂度,文中提出了一种基于纹理特征分析的深度图像帧内编码单元(CU)快速划分算法。首先,对深度图像的编码树单元(CTU)进行初级纹理特征分析,根据深度图像的纹理变化特征,在大津法的基础上对全局灰度进行分级,再通过判断CTU内采样点的纹理复杂度以及纹理方向标识来确定当前CTU的划分趋势。然后,对纹理复杂度高的CTU进行CU级别的精细纹理特征分析,利用CU内部像素分布的统计特征,自底向上计算不同尺寸的CU的纹理划分标识。最后,根据CTU的纹理复杂度、纹理方向标识以及CU的纹理划分标识预测当前CTU的划分深度范围,并判断是否提前终止CU划分。实验结果表明,与3D-HEVC参考模型中的原始算法相比,所提算法在平均增加0.8%左右码率的同时,能够降低45%左右的编码时间,同时保持了良好的编码率失真性能;与现有的3种快速算法相比,所提算法在整体序列上分别降低了约12%,3%,4%的编码时间,而在大分辨率序列上则分别降低了14%,11%,10%的编码时间,并具有相近的编码率失真性能。