针对多功能视频编码(Versatile Video Coding,VVC)标准中跨通道线性预测模型(Cross-Component Linear Model,CCLM)无法很好地拟合色度与亮度之间的非线性对应关系这一不足,提出了一种基于注意力机制卷积神经网络的VVC色度预测算法。该...针对多功能视频编码(Versatile Video Coding,VVC)标准中跨通道线性预测模型(Cross-Component Linear Model,CCLM)无法很好地拟合色度与亮度之间的非线性对应关系这一不足,提出了一种基于注意力机制卷积神经网络的VVC色度预测算法。该算法主要思想是在进行色度预测时,使用对应亮度块的信息与待预测色度块上方与左方的信息作为参考信息输入进卷积神经网络,利用注意力机制对参考信息中的亮度与色度间的内在联系进行分配权重后输入预测网络。实验结果表明,相较于VVC标准算法U分量和V分量的平均码率节省分别为0.64%和0.68%,有效提升了VVC编码性能。展开更多
为了提升高效视频编码(High Efficiency Video Coding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(Coding Tree Unit,CTU)的帧内划分结构,从而减少了...为了提升高效视频编码(High Efficiency Video Coding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(Coding Tree Unit,CTU)的帧内划分结构,从而减少了编码器对CTU进行四叉树递归遍历划分的编码时间。原始编码策略中粗模式决策通过基于残差经哈德曼变换的预测残差绝对值总和(Sum of Absolute Transformed Difference,SATD)的损失值来估计率失真优化过程中的率失真损失值来进行加速,但仍会耗费一定的编码时间。提出一种方法通过采样搜索的方式减少粗模式决策过程中计算的模式数,从35种模式降低到了18种模式,降低了粗模式决策过程中计算估计损失值的时间。由粗模式决策过程得到的较优的多个候选帧内模式来进行率失真优化,为了缩减粗模式决策需要计算的候选模式数,在候选模式列表中根据前后帧内预测角度模式的估计损失值的差距来筛选掉部分可能性较低的候选模式实现早停止决策,从而减少需要进行率失真优化的候选模式数量,进而减少率失真优化过程的计算时间。本文提出的算法在测试序列上平均实现78.15%的编码时间缩减,BD-PSNR为-0.168 d B,BD-RATE为3.49%。展开更多
开放媒体联盟开发的第一代视频编码标准(Alliance for Open Media Video 1,AV1)作为新一代的开放式视频编码技术,以其高压缩效率和高质量视频输出等优势成为在线视频领域的主流编解码标准之一。旨在优化帧内预测编码技术以降低编码运行...开放媒体联盟开发的第一代视频编码标准(Alliance for Open Media Video 1,AV1)作为新一代的开放式视频编码技术,以其高压缩效率和高质量视频输出等优势成为在线视频领域的主流编解码标准之一。旨在优化帧内预测编码技术以降低编码运行的计算复杂度,从而节约视频编码时间。为此,提出了长边采样(Long-side Sampling, LS)和长边稀疏采样(Long-side Sparse Sampling, LSS)的参考像素选择方法,根据块的划分方式规律地提取关键参考像素,以改进直流(Direct Current, DC)预测和亮度预测色度(Chroma from Luma, CfL)预测技术的性能。实验结果表明,LSS可以规避运算中的除法操作且减少大量加法计算量,在全I帧(All Intra, AI)和随机接入(Random Access, RA)配置下,相较原始算法平均编码时间减少11%和13%,同时节省0.03%和0.04%的Bj?ntegaard Delta Bit Rate(BDBR)。展开更多
为了面向低延时的浅压缩场景提供更加适配的编码方案,并降低硬件实现成本,提出一种基于数字音视频编解码技术标准(Audio Video coding Standard,AVS)浅压缩算法的帧内预测模式优化以及快速率失真优化算法。该算法通过减少原有算法帧内...为了面向低延时的浅压缩场景提供更加适配的编码方案,并降低硬件实现成本,提出一种基于数字音视频编解码技术标准(Audio Video coding Standard,AVS)浅压缩算法的帧内预测模式优化以及快速率失真优化算法。该算法通过减少原有算法帧内预测所需的预测循环次数,以及打破各块之间的数据依赖关系等措施,克服了原始方案不适合硬件流水并行处理的限制,提高了编码的效率和稳定性,从而既保障了算法的视频质量,又使新的硬件实现方案更符合实际应用需求。实验结果表明,该算法优化方案能够有效改善实际面向低延时浅压缩场景下的编码效果。展开更多
文摘针对多功能视频编码(Versatile Video Coding,VVC)标准中跨通道线性预测模型(Cross-Component Linear Model,CCLM)无法很好地拟合色度与亮度之间的非线性对应关系这一不足,提出了一种基于注意力机制卷积神经网络的VVC色度预测算法。该算法主要思想是在进行色度预测时,使用对应亮度块的信息与待预测色度块上方与左方的信息作为参考信息输入进卷积神经网络,利用注意力机制对参考信息中的亮度与色度间的内在联系进行分配权重后输入预测网络。实验结果表明,相较于VVC标准算法U分量和V分量的平均码率节省分别为0.64%和0.68%,有效提升了VVC编码性能。
文摘为了提升高效视频编码(High Efficiency Video Coding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(Coding Tree Unit,CTU)的帧内划分结构,从而减少了编码器对CTU进行四叉树递归遍历划分的编码时间。原始编码策略中粗模式决策通过基于残差经哈德曼变换的预测残差绝对值总和(Sum of Absolute Transformed Difference,SATD)的损失值来估计率失真优化过程中的率失真损失值来进行加速,但仍会耗费一定的编码时间。提出一种方法通过采样搜索的方式减少粗模式决策过程中计算的模式数,从35种模式降低到了18种模式,降低了粗模式决策过程中计算估计损失值的时间。由粗模式决策过程得到的较优的多个候选帧内模式来进行率失真优化,为了缩减粗模式决策需要计算的候选模式数,在候选模式列表中根据前后帧内预测角度模式的估计损失值的差距来筛选掉部分可能性较低的候选模式实现早停止决策,从而减少需要进行率失真优化的候选模式数量,进而减少率失真优化过程的计算时间。本文提出的算法在测试序列上平均实现78.15%的编码时间缩减,BD-PSNR为-0.168 d B,BD-RATE为3.49%。
文摘开放媒体联盟开发的第一代视频编码标准(Alliance for Open Media Video 1,AV1)作为新一代的开放式视频编码技术,以其高压缩效率和高质量视频输出等优势成为在线视频领域的主流编解码标准之一。旨在优化帧内预测编码技术以降低编码运行的计算复杂度,从而节约视频编码时间。为此,提出了长边采样(Long-side Sampling, LS)和长边稀疏采样(Long-side Sparse Sampling, LSS)的参考像素选择方法,根据块的划分方式规律地提取关键参考像素,以改进直流(Direct Current, DC)预测和亮度预测色度(Chroma from Luma, CfL)预测技术的性能。实验结果表明,LSS可以规避运算中的除法操作且减少大量加法计算量,在全I帧(All Intra, AI)和随机接入(Random Access, RA)配置下,相较原始算法平均编码时间减少11%和13%,同时节省0.03%和0.04%的Bj?ntegaard Delta Bit Rate(BDBR)。
文摘为了面向低延时的浅压缩场景提供更加适配的编码方案,并降低硬件实现成本,提出一种基于数字音视频编解码技术标准(Audio Video coding Standard,AVS)浅压缩算法的帧内预测模式优化以及快速率失真优化算法。该算法通过减少原有算法帧内预测所需的预测循环次数,以及打破各块之间的数据依赖关系等措施,克服了原始方案不适合硬件流水并行处理的限制,提高了编码的效率和稳定性,从而既保障了算法的视频质量,又使新的硬件实现方案更符合实际应用需求。实验结果表明,该算法优化方案能够有效改善实际面向低延时浅压缩场景下的编码效果。