H.266/VVC(Versatile Video Coding)是目前最为先进的视频编码标准,其为了适应更加复杂纹理的视频图像,在上一代视频编码标准H.265/HEVC(High Efficiency Video Coding)基础上引入了带有嵌套多类型树的四叉树,使得图像的块划分灵活,在...H.266/VVC(Versatile Video Coding)是目前最为先进的视频编码标准,其为了适应更加复杂纹理的视频图像,在上一代视频编码标准H.265/HEVC(High Efficiency Video Coding)基础上引入了带有嵌套多类型树的四叉树,使得图像的块划分灵活,在提升编码性能的同时带来了显著增加的计算量。针对以上问题,提出了基于Sobel边缘检测的帧内快速CU划分技术,利用边缘特征来跳过几种CU划分方式达到减少运算量的效果,在AI(All In⁃tra)模式下,编码时间平均减少了39.95%,而BDBR(Bjøntegaard Delta Bitrate)仅上升了0.73%。展开更多
近年来,面向机器视觉视频的研究和应用越来越广泛,这对此类视频的存储和传输都提出了巨大的挑战。视频编码标准如多功能视频编码(Versatile Video Coding,VVC)能实现高效的全分辨率压缩与重建,但是对机器视觉任务而言,这种压缩方法是有...近年来,面向机器视觉视频的研究和应用越来越广泛,这对此类视频的存储和传输都提出了巨大的挑战。视频编码标准如多功能视频编码(Versatile Video Coding,VVC)能实现高效的全分辨率压缩与重建,但是对机器视觉任务而言,这种压缩方法是有冗余的。因此,提出了一种在VVC编码过程中结合显著性检测的视频编码方法用于机器任务,用实例分割网络掩膜基于区域的卷积神经网络(Mask Region-based Convolutional Neural Network,Mask R-CNN)获得包含对象的二进制掩膜,并依此判定是否为感兴趣区域,指导VVC编码过程中编码树单元(Coding Tree Unit,CTU)的量化参数的偏移。实验证明,与VVC基线方法相比,所提方法可以在相似的检测精度下节省一定的比特率。展开更多
针对H.266/多功能视频编码(Versatile Video Coding,VVC)帧间仿射运动估计复杂度高的问题,提出了一种基于已重建先验信息的快速仿射运动估计算法。该算法利用帧间跳过(Skip)模式和仿射运动估计(Affine)模式之间的互斥性,根据上层级编码...针对H.266/多功能视频编码(Versatile Video Coding,VVC)帧间仿射运动估计复杂度高的问题,提出了一种基于已重建先验信息的快速仿射运动估计算法。该算法利用帧间跳过(Skip)模式和仿射运动估计(Affine)模式之间的互斥性,根据上层级编码块(Coding Unit,CU)、本层级子CU和相邻CU的重建信息跳过冗余的仿射运动估计过程,以降低仿射运动估计的复杂度。实验结果表明,在不明显影响视频码率和质量的情况下,该算法的编码时间相较于VVC标准整体下降了10.17%,仿射运动估计时间下降了44.2%,有效地降低了仿射运动估计的复杂度。展开更多
随着虚拟现实技术的发展,360度视频越来越受欢迎。这些视频在使用标准编码器进行编码之前,要先将其转换为2D图像平面格式。为了提高编码效率,专家们提出了新一代视频编码标准H.266/VVC(Versatile Video Coding),然而,VVC分区模式的多样...随着虚拟现实技术的发展,360度视频越来越受欢迎。这些视频在使用标准编码器进行编码之前,要先将其转换为2D图像平面格式。为了提高编码效率,专家们提出了新一代视频编码标准H.266/VVC(Versatile Video Coding),然而,VVC分区模式的多样性导致编码360度高分辨率视频耗时过长。针对上述问题,设计一种CU划分早期决策算法。通过对ERP(Equirectangular projection)视频的统计实验,发现这类视频采用水平分区的概率大于垂直分区。利用经验变差函数设计算法衡量纹理方向差异度,再根据编码单元水平与垂直2个方向的差异程度选择不同的分区。实验结果表明:在全帧内模式下,与VVC测试模型VTM4.0相比,该算法节省了35.42%的编码时间,BD-rate仅增加0.70%。展开更多
针对多功能视频编码(versatile video coding,VVC)帧内编码中编码单元(coding units,CU)划分存在计算复杂度过高的问题,本文提出了一种基于DenseNet+FPN(feature pyramid network)的CU快速划分算法。该算法能够大幅度降低VVC的编码复杂...针对多功能视频编码(versatile video coding,VVC)帧内编码中编码单元(coding units,CU)划分存在计算复杂度过高的问题,本文提出了一种基于DenseNet+FPN(feature pyramid network)的CU快速划分算法。该算法能够大幅度降低VVC的编码复杂度,减少编码时间。首先,本文提出了一种基于纹理复杂度的CU分类算法,来评估CU块的纹理复杂度。其次,提出一种基于DenseNet+FPN的网络模型,利用多尺度信息来优化CU划分,以适应多尺度情况下的编码需求。最后,设计了一个新的自适应的质量复杂度均衡损失函数,用于平衡编码质量和计算复杂度。所提算法进行了大量的实验分析,结果证明,与公共参考软件(WC test model 10.0,VTM10.0)相比,所提算法的帧内编码平均时间减少了44.268%,而BDBR(bj?ntegaard delta bit rate)仅增加了0.94%。展开更多
文摘H.266/VVC(Versatile Video Coding)是目前最为先进的视频编码标准,其为了适应更加复杂纹理的视频图像,在上一代视频编码标准H.265/HEVC(High Efficiency Video Coding)基础上引入了带有嵌套多类型树的四叉树,使得图像的块划分灵活,在提升编码性能的同时带来了显著增加的计算量。针对以上问题,提出了基于Sobel边缘检测的帧内快速CU划分技术,利用边缘特征来跳过几种CU划分方式达到减少运算量的效果,在AI(All In⁃tra)模式下,编码时间平均减少了39.95%,而BDBR(Bjøntegaard Delta Bitrate)仅上升了0.73%。
文摘近年来,面向机器视觉视频的研究和应用越来越广泛,这对此类视频的存储和传输都提出了巨大的挑战。视频编码标准如多功能视频编码(Versatile Video Coding,VVC)能实现高效的全分辨率压缩与重建,但是对机器视觉任务而言,这种压缩方法是有冗余的。因此,提出了一种在VVC编码过程中结合显著性检测的视频编码方法用于机器任务,用实例分割网络掩膜基于区域的卷积神经网络(Mask Region-based Convolutional Neural Network,Mask R-CNN)获得包含对象的二进制掩膜,并依此判定是否为感兴趣区域,指导VVC编码过程中编码树单元(Coding Tree Unit,CTU)的量化参数的偏移。实验证明,与VVC基线方法相比,所提方法可以在相似的检测精度下节省一定的比特率。
文摘针对H.266/多功能视频编码(Versatile Video Coding,VVC)帧间仿射运动估计复杂度高的问题,提出了一种基于已重建先验信息的快速仿射运动估计算法。该算法利用帧间跳过(Skip)模式和仿射运动估计(Affine)模式之间的互斥性,根据上层级编码块(Coding Unit,CU)、本层级子CU和相邻CU的重建信息跳过冗余的仿射运动估计过程,以降低仿射运动估计的复杂度。实验结果表明,在不明显影响视频码率和质量的情况下,该算法的编码时间相较于VVC标准整体下降了10.17%,仿射运动估计时间下降了44.2%,有效地降低了仿射运动估计的复杂度。
文摘随着虚拟现实技术的发展,360度视频越来越受欢迎。这些视频在使用标准编码器进行编码之前,要先将其转换为2D图像平面格式。为了提高编码效率,专家们提出了新一代视频编码标准H.266/VVC(Versatile Video Coding),然而,VVC分区模式的多样性导致编码360度高分辨率视频耗时过长。针对上述问题,设计一种CU划分早期决策算法。通过对ERP(Equirectangular projection)视频的统计实验,发现这类视频采用水平分区的概率大于垂直分区。利用经验变差函数设计算法衡量纹理方向差异度,再根据编码单元水平与垂直2个方向的差异程度选择不同的分区。实验结果表明:在全帧内模式下,与VVC测试模型VTM4.0相比,该算法节省了35.42%的编码时间,BD-rate仅增加0.70%。
文摘针对多功能视频编码(versatile video coding,VVC)帧内编码中编码单元(coding units,CU)划分存在计算复杂度过高的问题,本文提出了一种基于DenseNet+FPN(feature pyramid network)的CU快速划分算法。该算法能够大幅度降低VVC的编码复杂度,减少编码时间。首先,本文提出了一种基于纹理复杂度的CU分类算法,来评估CU块的纹理复杂度。其次,提出一种基于DenseNet+FPN的网络模型,利用多尺度信息来优化CU划分,以适应多尺度情况下的编码需求。最后,设计了一个新的自适应的质量复杂度均衡损失函数,用于平衡编码质量和计算复杂度。所提算法进行了大量的实验分析,结果证明,与公共参考软件(WC test model 10.0,VTM10.0)相比,所提算法的帧内编码平均时间减少了44.268%,而BDBR(bj?ntegaard delta bit rate)仅增加了0.94%。