相较于传统的图像压缩技术,深度图像压缩可以提供更优的率失真性能,甚至可以超越最新的压缩编码标准多功能视频编码(Versatile Video Coding,VVC)。然而,随着网络复杂度的提升,深度图像压缩技术的提升亦有瓶颈。因此,提出了非对称离散...相较于传统的图像压缩技术,深度图像压缩可以提供更优的率失真性能,甚至可以超越最新的压缩编码标准多功能视频编码(Versatile Video Coding,VVC)。然而,随着网络复杂度的提升,深度图像压缩技术的提升亦有瓶颈。因此,提出了非对称离散高斯分布的深度图像压缩方法。并非优化编解码器或是熵模型,该方法在隐空间借助语义信息和稀疏过程,实现单高斯分布向非对称高斯分布的迁移,以节约码流。相较其他方法,所提方法具有更优的率失真性能,在Kodak数据集上解码的图像更加真实自然。展开更多
近年来,面向机器视觉视频的研究和应用越来越广泛,这对此类视频的存储和传输都提出了巨大的挑战。视频编码标准如多功能视频编码(Versatile Video Coding,VVC)能实现高效的全分辨率压缩与重建,但是对机器视觉任务而言,这种压缩方法是有...近年来,面向机器视觉视频的研究和应用越来越广泛,这对此类视频的存储和传输都提出了巨大的挑战。视频编码标准如多功能视频编码(Versatile Video Coding,VVC)能实现高效的全分辨率压缩与重建,但是对机器视觉任务而言,这种压缩方法是有冗余的。因此,提出了一种在VVC编码过程中结合显著性检测的视频编码方法用于机器任务,用实例分割网络掩膜基于区域的卷积神经网络(Mask Region-based Convolutional Neural Network,Mask R-CNN)获得包含对象的二进制掩膜,并依此判定是否为感兴趣区域,指导VVC编码过程中编码树单元(Coding Tree Unit,CTU)的量化参数的偏移。实验证明,与VVC基线方法相比,所提方法可以在相似的检测精度下节省一定的比特率。展开更多
文摘相较于传统的图像压缩技术,深度图像压缩可以提供更优的率失真性能,甚至可以超越最新的压缩编码标准多功能视频编码(Versatile Video Coding,VVC)。然而,随着网络复杂度的提升,深度图像压缩技术的提升亦有瓶颈。因此,提出了非对称离散高斯分布的深度图像压缩方法。并非优化编解码器或是熵模型,该方法在隐空间借助语义信息和稀疏过程,实现单高斯分布向非对称高斯分布的迁移,以节约码流。相较其他方法,所提方法具有更优的率失真性能,在Kodak数据集上解码的图像更加真实自然。
文摘近年来,面向机器视觉视频的研究和应用越来越广泛,这对此类视频的存储和传输都提出了巨大的挑战。视频编码标准如多功能视频编码(Versatile Video Coding,VVC)能实现高效的全分辨率压缩与重建,但是对机器视觉任务而言,这种压缩方法是有冗余的。因此,提出了一种在VVC编码过程中结合显著性检测的视频编码方法用于机器任务,用实例分割网络掩膜基于区域的卷积神经网络(Mask Region-based Convolutional Neural Network,Mask R-CNN)获得包含对象的二进制掩膜,并依此判定是否为感兴趣区域,指导VVC编码过程中编码树单元(Coding Tree Unit,CTU)的量化参数的偏移。实验证明,与VVC基线方法相比,所提方法可以在相似的检测精度下节省一定的比特率。