期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
沉浸式视频编码技术综述
1
作者 曾焕强 孔庆玮 +3 位作者 陈婧 朱建清 施一帆 侯军辉 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期602-614,共13页
随着虚拟现实、增强现实等沉浸式媒体技术的发展,沉浸式视频的表示、存储、传输和显示等各个环节都受到了科研及产业界的广泛关注。沉浸式视频更复杂的视频特性和庞大的数据量,对传统视频编码技术提出了挑战,新的编码技术应运而生。该... 随着虚拟现实、增强现实等沉浸式媒体技术的发展,沉浸式视频的表示、存储、传输和显示等各个环节都受到了科研及产业界的广泛关注。沉浸式视频更复杂的视频特性和庞大的数据量,对传统视频编码技术提出了挑战,新的编码技术应运而生。该文从视频自由度(DoF)出发,分别从3DoF和6DoF两个方面介绍沉浸式视频编码技术的最新成果。3DoF视频相关编码技术包括投影模型、运动估计模型和3DoF视频编码标准。6DoF视频相关编码技术包括视频表示形式、虚拟视点合成技术、6DoF视频编码技术及运动图像专家组沉浸式视频(MPEG,MIV)编码标准。最后,对沉浸式视频及其编码技术的发展进行总结和展望。 展开更多
关键词 视频编码 沉浸式视频 全景视频 自由视点视频
下载PDF
基于宽度自编码网络的单分类集成算法
2
作者 施一帆 陈宇昂 +1 位作者 曾焕强 杨楷翔 《信号处理》 CSCD 北大核心 2024年第4期776-788,共13页
异常检测是模式识别领域的经典研究,然而在极端类别不平衡场景下,异常样本匮乏,训练数据仅包含正常样本,传统异常检测方法难以适用。因此,单分类算法逐渐受到关注,它只使用目标类样本构建决策边界,实现对非目标类样本的识别。目前单分... 异常检测是模式识别领域的经典研究,然而在极端类别不平衡场景下,异常样本匮乏,训练数据仅包含正常样本,传统异常检测方法难以适用。因此,单分类算法逐渐受到关注,它只使用目标类样本构建决策边界,实现对非目标类样本的识别。目前单分类算法已经取得了显著进展,然而也存在一些局限性:(1)原始特征空间容易受噪声特征干扰;(2)单模型的单分类算法难以从多个特征空间学习更全面的决策边界;(3)缺少对先前模型的欠拟合样本进行针对性学习。为了解决这些问题,本文提出了基于宽度自编码网络的单分类集成算法(Ensemble One-class Classification Based on BLS-Autoencoder,EOC-BLSAE)。首先,本文设计了一种单分类宽度自编码网络模型(One-class BLS-Autoencoder,OC-BLSAE),它能高效学习原始特征空间到重构特征空间的非线性映射关系,利用重构误差构建决策边界;接着,本文设计了单分类Boosting策略,通过最小化全局重构损失,迭代学习欠拟合样本,从而多角度构建OC-BLSAE模型,并自适应评估模型的可靠性;最终,加权集成多个OC-BLSAE模型,有效提升整体算法准确性和鲁棒性。在实验中,本文在16个不同规模的单分类任务上进行参数实验、对比实验和消融实验,结果表明所提算法参数选择较为灵活,算法各模块能够相互协同,有效提升单分类任务的准确性和鲁棒性,整体性能超过前沿单分类方法。 展开更多
关键词 单分类 异常检测 宽度学习系统 集成学习
下载PDF
基于度量正则化的红外与可见光跨模态行人重识别算法 被引量:2
3
作者 吴含笑 赵倩倩 +3 位作者 朱建清 曾焕强 杜吉祥 廖昀 《计算机科学》 CSCD 北大核心 2023年第S01期344-351,共8页
红外与可见光跨模态行人重识别对提升智能视频监控系统的全天作战能力具有重要作用。现有跨模态行人重识别方法通常专注于特征对齐,未重视多模态度量对齐,导致重识别对模态变化不够鲁棒。为此,提出一种基于度量正则化的红外与可见光跨... 红外与可见光跨模态行人重识别对提升智能视频监控系统的全天作战能力具有重要作用。现有跨模态行人重识别方法通常专注于特征对齐,未重视多模态度量对齐,导致重识别对模态变化不够鲁棒。为此,提出一种基于度量正则化的红外与可见光跨模态行人重识别算法。首先,设计度量正则化损失函数,用于约束不同模态检索模式下匹配行为的差异,提升算法的鲁棒性。其次,考虑到实际监控场景中红外图像的数量少于可见光图像的数量,利用模态数据比例修正交叉熵损失函数,减少模态数据不平衡对模型训练的不利影响。实验结果证明了所提算法的优越性,例如在RegDB数据集由可见光检索红外图像的首位识别率达到89.52%。 展开更多
关键词 度量正则化损失函数 度量对齐 跨模态 行人重识别 智能视频监控系统
下载PDF
Visible-infrared person re-identification using query related cluster
4
作者 赵倩倩 WU Hanxiao +2 位作者 HUANG Linhan ZHU Jianqing zeng huanqiang 《High Technology Letters》 EI CAS 2023年第2期194-205,共12页
Visible-infrared person re-identification(VIPR), is a cross-modal retrieval task that searches a target from a gallery captured by cameras of different spectrums.The severe challenge for VIPR is the large intra-class ... Visible-infrared person re-identification(VIPR), is a cross-modal retrieval task that searches a target from a gallery captured by cameras of different spectrums.The severe challenge for VIPR is the large intra-class variation caused by the modal discrepancy between visible and infrared images.For that, this paper proposes a query related cluster(QRC) method for VIPR.Firstly, this paper uses an attention mechanism to calculate the similarity relation between a visible query and infrared images with the same identity in the gallery.Secondly, those infrared images with the same query images are aggregated by using the similarity relation to form a dynamic clustering center corresponding to the query image.Thirdly, QRC loss function is designed to enlarge the similarity between the query image and its dynamic cluster center to achieve query related clustering, so as to compact the intra-class variations.Consequently, in the proposed QRC method, each query has its own dynamic clustering center, which can well characterize intra-class variations in VIPR.Experimental results demonstrate that the proposed QRC method is superior to many state-of-the-art approaches, acquiring a 90.77% rank-1 identification rate on the RegDB dataset. 展开更多
关键词 query related cluster(QRC) cross-modality visible-infrared person re-identification(VIPR) video surveillance
下载PDF
RGB and LBP-texture deep nonlinearly fusion features for fabric retrieval 被引量:1
5
作者 Shen Fei Wei Mengwan +2 位作者 Liu Jiajun zeng huanqiang Zhu Jianqing 《High Technology Letters》 EI CAS 2020年第2期196-203,共8页
Fabric retrieval is very challenging since problems like viewpoint variations,illumination changes,blots,and poor image qualities are usually encountered in fabric images.In this work,a novel deep feature nonlinear fu... Fabric retrieval is very challenging since problems like viewpoint variations,illumination changes,blots,and poor image qualities are usually encountered in fabric images.In this work,a novel deep feature nonlinear fusion network(DFNFN)is proposed to nonlinearly fuse features learned from RGB and texture images for improving fabric retrieval.Texture images are obtained by using local binary pattern texture(LBP-Texture)features to describe RGB fabric images.The DFNFN firstly applies two feature learning branches to deal with RGB images and the corresponding LBP-Texture images simultaneously.Each branch contains the same convolutional neural network(CNN)architecture but independently learning parameters.Then,a nonlinear fusion module(NFM)is designed to concatenate the features produced by the two branches and nonlinearly fuse the concatenated features via a convolutional layer followed with a rectified linear unit(ReLU).The NFM is flexible since it can be embedded in different depths of the DFNFN to find the best fusion position.Consequently,DFNFN can optimally fuse features learned from RGB and LBP-Texture images to boost the retrieval accuracy.Extensive experiments on the Fabric 1.0 dataset show that the proposed method is superior to many state-of-the-art methods. 展开更多
关键词 FABRIC RETRIEVAL feature FUSION convolutional neural network(CNN)
下载PDF
可自纠错的联合式加密图像可逆数据隐藏算法 被引量:4
6
作者 邱应强 蔡灿辉 +3 位作者 曾焕强 冯桂 林晓丹 钱振兴 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2021年第1期107-116,共10页
为了解决现有联合式加密图像可逆数据隐藏方法中存在的数据提取误码问题,并提高此类方法的数据嵌入容量,提出了一种兼具自纠错和内容隐私保护功能的新算法。该算法在图像加密前通过预处理生成纠错数据并以可逆方式自嵌入到图像下采样像... 为了解决现有联合式加密图像可逆数据隐藏方法中存在的数据提取误码问题,并提高此类方法的数据嵌入容量,提出了一种兼具自纠错和内容隐私保护功能的新算法。该算法在图像加密前通过预处理生成纠错数据并以可逆方式自嵌入到图像下采样像素中,图像加密后只需保留或翻转其中各非采样像素分组的若干位最低有效位即可嵌入数据,图像解密后可100%正确提取嵌入数据并无失真恢复原图像。实验结果表明,该算法在解决联合式方法数据提取误码问题的基础上,大大提高了数据嵌入容量,同时直接解密得到的载密图像质量良好。该技术在军事、医学、云服务等众多领域有着广泛的应用价值。 展开更多
关键词 可逆数据隐藏 整数变换 加密 插值
下载PDF
参数化二叉树编码实现加密图像可逆数据隐藏 被引量:2
7
作者 邱应强 陈馨 +2 位作者 杨玉燕 曾焕强 钱振兴 《应用科学学报》 CAS CSCD 北大核心 2022年第3期457-469,共13页
为了提高数据嵌入容量,提出了一种基于参数化二叉树编码的加密图像可逆数据隐藏新方法。该方法的系统由图像所有者、数据嵌入者和授权接收者三方组成,其中,图像所有者采用特殊的图像块随机调制和置乱对原始图像加密并上传;由于加密操作... 为了提高数据嵌入容量,提出了一种基于参数化二叉树编码的加密图像可逆数据隐藏新方法。该方法的系统由图像所有者、数据嵌入者和授权接收者三方组成,其中,图像所有者采用特殊的图像块随机调制和置乱对原始图像加密并上传;由于加密操作很好地保留了图像块的像素相关性,数据嵌入者可在加密域充分利用图像块相关性,通过自适应选择参考像素来预测同一图像块的其余像素得到预测差值,再使用参数化二叉树编码进行无损压缩生成嵌入空间,实现大容量数据嵌入;授权接收者可正确提取嵌入数据或无失真恢复原图像。仿真实验结果表明:所提方法提高了嵌入容量,且可用于医学、云服务、军事等众多领域。 展开更多
关键词 可逆数据隐藏 加密图像 二叉树编码 嵌入容量
下载PDF
沉浸式视频质量评价综述 被引量:3
8
作者 曾焕强 丁瑞 +2 位作者 黄海靓 陈婧 朱建清 《信号处理》 CSCD 北大核心 2022年第9期1853-1862,共10页
近年来,随着计算机视觉处理技术的深入研究和虚拟现实设备的不断普及,沉浸式媒体技术飞速发展并在各个领域得到初步应用。考虑到沉浸式视频产生的质量损耗会影响用户身临其境的沉浸式视觉感受,基于沉浸式视频的质量评价研究成为视频处... 近年来,随着计算机视觉处理技术的深入研究和虚拟现实设备的不断普及,沉浸式媒体技术飞速发展并在各个领域得到初步应用。考虑到沉浸式视频产生的质量损耗会影响用户身临其境的沉浸式视觉感受,基于沉浸式视频的质量评价研究成为视频处理领域的研究重点并逐渐引起研究者们的重视。如何量化沉浸式视频的质量损耗并进行质量评价,设计符合人眼视觉感知的算法,用以准确高效地评估视频质量,对于沉浸式视频处理研究领域的发展具有学术研究意义和实际应用价值。本文首先回顾了沉浸式视频主观质量评价数据库和客观质量评价方法的研究,然后介绍了近期涉及沉浸式视频质量评价的主要技术,即深度信息和虚拟视图合成,最后对沉浸式视频质量评价研究工作进行总结和展望。 展开更多
关键词 沉浸式视频 质量评价 数据库 深度信息 虚拟视图合成
下载PDF
深度神经网络压缩与加速综述 被引量:13
9
作者 曾焕强 胡浩麟 +2 位作者 林向伟 侯军辉 蔡灿辉 《信号处理》 CSCD 北大核心 2022年第1期183-194,共12页
近年来,随着图形处理器性能的飞速提升,深度神经网络取得了巨大的发展成就,在许多人工智能任务中屡创佳绩。然而,主流的深度学习网络模型由于存在计算复杂度高、内存占用较大、耗时长等缺陷,难以部署在计算资源受限的移动设备或时延要... 近年来,随着图形处理器性能的飞速提升,深度神经网络取得了巨大的发展成就,在许多人工智能任务中屡创佳绩。然而,主流的深度学习网络模型由于存在计算复杂度高、内存占用较大、耗时长等缺陷,难以部署在计算资源受限的移动设备或时延要求严格的应用中。因此,在不显著影响模型精度的前提下,通过对深度神经网络进行压缩和加速来轻量化模型逐渐引起研究者们的重视。本文回顾了近年来的深度神经网络压缩和加速技术。这些技术分为四类:参数量化、模型剪枝、轻量型卷积核设计和知识蒸馏。对于每个技术类别,本文首先分析了各自的性能及存在的缺陷。另外,本文总结了模型压缩与加速的性能评估方法。最后,讨论了模型压缩与加速领域存在的挑战和未来研究的可能方向。 展开更多
关键词 深度神经网络压缩与加速 深度学习 模型剪枝 知识蒸馏 参数量化
下载PDF
基于新型三元卷积神经网络的行人再辨识算法 被引量:2
10
作者 朱建清 曾焕强 +3 位作者 杜永兆 雷震 郑力新 蔡灿辉 《电子与信息学报》 EI CSCD 北大核心 2018年第4期1012-1016,共5页
基于三元卷积神经网络的行人再辨识算法多数采用欧式距离度量行人之间的相似度,并配合铰链(hinge)损失函数进行卷积神经网络的训练。然而,这种作法存在两个不足:欧式距离作为行人相似度,鉴别力不够强;铰链损失函数的间隔(Margin)参数设... 基于三元卷积神经网络的行人再辨识算法多数采用欧式距离度量行人之间的相似度,并配合铰链(hinge)损失函数进行卷积神经网络的训练。然而,这种作法存在两个不足:欧式距离作为行人相似度,鉴别力不够强;铰链损失函数的间隔(Margin)参数设定依赖于人工预先设定且在训练过程中无法自适应调整。为此,针对上述两个不足进行改进,该文提出一种基于新型三元卷积神经网络的行人再辨识算法,以提高行人再辨识的准确率。首先,提出一种归一化混合度量函数取代传统的度量方法进行行人相似度计算,提高了行人相似度度量的鉴别力;其次,提出采用Log-logistic函数代替铰链函数,无需人工设定间隔参数,改进了特征与度量函数的联合优化效果。实验结果表明,所提出的算法在Auto Detected CUHK03和VIPe R两个数据库上的准确率均获得显著的提升,验证了所提出算法的优越性。 展开更多
关键词 行人再辨识 深度学习 三元卷积神经网络
下载PDF
采用联合特征的H.266/VVC屏幕内容快速模式选择算法 被引量:1
11
作者 岳洋洋 曾焕强 +2 位作者 陈婧 林晓丹 蔡灿辉 《信号处理》 CSCD 北大核心 2021年第8期1479-1486,共8页
新一代视频编码标准H.266/VVC针对屏幕内容编码引入帧内块复制、调色板等预测模式,在提高编码效率的同时也带来了巨大的计算复杂度。本文采用角点、水平/垂直活动度和平均颜色亮度差联合特征对屏幕内容视频帧和当前编码单元(Coding Unit... 新一代视频编码标准H.266/VVC针对屏幕内容编码引入帧内块复制、调色板等预测模式,在提高编码效率的同时也带来了巨大的计算复杂度。本文采用角点、水平/垂直活动度和平均颜色亮度差联合特征对屏幕内容视频帧和当前编码单元(Coding Unit,CU)进行分类,将视频帧分为低对比度屏幕视频帧和高对比度屏幕视频帧,将CU细分为自然内容背景CU、屏幕内容背景CU和屏幕内容前景CU,进而对CU模式进行选择性跳过,减少模式选择代价。实验结果显示,在全帧内的条件下,该算法与开启IBC和PLT的H.266/VVC VTM-7.3标准相比,在码率仅增加1.21%的情况下节省了26.41%的编码时间,降低了编码复杂度。 展开更多
关键词 H.266/VVC 屏幕内容编码 快速模式选择
下载PDF
采用SIFT和VLAD特征编码的布匹检索算法 被引量:4
12
作者 朱建清 林露馨 +3 位作者 沈飞 曾焕强 蔡灿辉 郑力新 《信号处理》 CSCD 北大核心 2019年第10期1725-1731,共7页
本文提出一种采用尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)和局部聚合向量(Vector of Locally Aggregated Descriptors,VLAD)特征编码的布匹检索算法。首先,提取图像的SIFT特征,以对图像进行特征表达。但是,每张图像S... 本文提出一种采用尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)和局部聚合向量(Vector of Locally Aggregated Descriptors,VLAD)特征编码的布匹检索算法。首先,提取图像的SIFT特征,以对图像进行特征表达。但是,每张图像SIFT特征点数量可能不同,导致不同图像的特征向量维度不一致,无法直接进行图像之间的相似度计算。为此,本文进一步对图像的SIFT特征进行VLAD编码,在保证不同图像的特征维度一致的同时,改进SIFT特征对图像的表达能力。在VLAD编码方面,先用K-means聚类算法生成视觉词典;再进行特征向量局部聚合。局部聚合过程包括:首先,计算图像中SIFT特征向量与对应视觉词之间的残差;然后,将每个视觉词相应的残差求和;最后,把各个视觉词上的残差求和值进行串联得到图像的VLAD编码。本文实验采用十次平均的累计匹配特性(Cumulative Match Characteristic,CMC)曲线作为性能指标。结果表明,本文所提出的方法能提高检索速度,且具有较高的识别率,其平均Rank 1识别率达到95.03%。 展开更多
关键词 布匹检索算法 VLAD特征编码 K-MEANS聚类算法 SIFT特征 CMC曲线
下载PDF
面向目标再辨识的空间和通道双重显著性挖掘算法 被引量:1
13
作者 沈飞 朱建清 +1 位作者 曾焕强 蔡灿辉 《信号处理》 CSCD 北大核心 2020年第9期1471-1480,共10页
现有的目标再辨识方法常用全局特征池化层来聚合深度骨干网络所提取的特征映射以得到最终的图像特征。但是,全局特征池化层忽视了特征映射在空间和通道上的显著性,会限制所得图像特征的鉴别能力。为此,本文设计一个新颖的空间和通道双... 现有的目标再辨识方法常用全局特征池化层来聚合深度骨干网络所提取的特征映射以得到最终的图像特征。但是,全局特征池化层忽视了特征映射在空间和通道上的显著性,会限制所得图像特征的鉴别能力。为此,本文设计一个新颖的空间和通道双重显著性挖掘(Spatial Channel Dual Significance Mining,SC-DSM)模块,用于同时从空间和通道两个维度上充分挖掘特征映射的显著性,从而改善所得图像特征的鉴别能力,以提升目标再辨识的准确性。SC-DSM模块包含空间显著性挖掘子模块和通道显著性挖掘子模块。其中,空间显著性挖掘子模块在特征映射上构建空间图,聚合空间维度上的邻居节点特征并学习权重,实现空间显著性挖掘;通道显著性挖掘子模块在特征映射建立通道图聚合通道维度上的邻居节点并学习权重,实现通道显著性挖掘。实验结果表明,在目前最流行的车辆再辨识数据库VeRi776和行人再辨识数据库Market-1501上,所提出的方法能够优于现有的目标再辨识方法。 展开更多
关键词 目标再辨识 空间显著性 通道显著性 深度学习
下载PDF
基于特征金字塔融合表征网络的跨模态哈希方法 被引量:1
14
作者 阮海涛 曾焕强 +2 位作者 朱建清 温廷羲 蔡灿辉 《信号处理》 CSCD 北大核心 2021年第7期1252-1259,共8页
随着多模态数据的爆发式增长,跨模态检索作为一种搜索多模态数据的最常用方法,受到越来越多的关注。然而,目前存在的大多数深度学习的方法仅仅采用模型后端最后一个全连接层输出作为模态独有的高层语义表征,忽视了多个层次上不同尺度特... 随着多模态数据的爆发式增长,跨模态检索作为一种搜索多模态数据的最常用方法,受到越来越多的关注。然而,目前存在的大多数深度学习的方法仅仅采用模型后端最后一个全连接层输出作为模态独有的高层语义表征,忽视了多个层次上不同尺度特征之间的语义相关性,具有一定的局限性。为此,本文提出一种基于特征金字塔融合表征网络的跨模态哈希检索方法。该方法设计了一种特征金字塔融合表征网络,通过在多个层次和不同尺度上进行特征提取并融合,挖掘多个层次上不同尺度下模态特征的语义相关性,充分利用模态特有的特征,使网络输出的语义表征更具有代表性。最后设计了三重损失函数:模态间损失,模态内损失和汉明空间损失对模型进行训练学习。实验结果表明,本文所提方法在MIRFLICKR-25K和NUS-WIDE数据集上均获得了良好的跨模态检索效果。 展开更多
关键词 跨模态检索 特征金字塔融合表征 哈希
下载PDF
基于多尺度特征残差学习卷积神经网络的视频超分辨率方法 被引量:9
15
作者 林琦 陈婧 +2 位作者 曾焕强 朱建清 蔡灿辉 《信号处理》 CSCD 北大核心 2020年第1期50-57,共8页
本文提出了一种基于多尺度特征残差学习卷积神经网络的视频超分辨率方法,考虑到视频帧之间的时空相关性,所提的方法采用由双三次插值预处理后的连续五帧视频作为卷积神经网络的输入,经由网络重建中间帧作为输出,依次按顺序重建,直至获... 本文提出了一种基于多尺度特征残差学习卷积神经网络的视频超分辨率方法,考虑到视频帧之间的时空相关性,所提的方法采用由双三次插值预处理后的连续五帧视频作为卷积神经网络的输入,经由网络重建中间帧作为输出,依次按顺序重建,直至获得整个高分辨率视频。本文所提出的卷积神经网络主要由多尺度特征提取、残差学习、亚像素卷积层、残差连接(skip-connection)四大部分组成,通过对视频的多尺度特征提取,获得更丰富的不同尺度特征,结合残差学习以更好地恢复高频信息。实验结果表明,本方法在峰值信噪比(PSNR)和结构相似性指数(SSIM)平均评价指标上较其他方法均有一定的提升(PSNR+3.151 dB,SSIM+0.102),从主观评价上看可以有效地减少视频边缘模糊的现象。 展开更多
关键词 视频超分辨率 卷积神经网络 多尺度特征 残差学习
下载PDF
基于多细节卷积神经网络的单幅图像去雨方法 被引量:8
16
作者 林向伟 曾焕强 +2 位作者 侯进辉 朱建清 蔡灿辉 《信号处理》 CSCD 北大核心 2019年第3期460-465,共6页
本文提出一种基于多细节卷积神经网络的单幅图像去雨方法。考虑到雨条信息大都存在于有雨图像的高频部分,所提方法将有雨图像通过引导滤波进行多次分解得到平滑图像和不同频率分布的多细节图像,提出多细节卷积神经网络学习有雨图像和无... 本文提出一种基于多细节卷积神经网络的单幅图像去雨方法。考虑到雨条信息大都存在于有雨图像的高频部分,所提方法将有雨图像通过引导滤波进行多次分解得到平滑图像和不同频率分布的多细节图像,提出多细节卷积神经网络学习有雨图像和无雨图像之间的映射关系,从而获得无雨图像。考虑到实际收集相同场景下的有雨图像和无雨图像难度较大,本文采用无雨图像和人工合成的有雨图像作为训练数据,而测试部分则采用合成的雨图和真实的雨图。实验结果表明,本文所提方法能够有效去除图像中的雨条信息。 展开更多
关键词 图像去雨 卷积神经网络 多细节
下载PDF
基于特征融合的无参考屏幕图像质量评价 被引量:5
17
作者 程姗 曾焕强 +2 位作者 陈婧 田钰 蔡灿辉 《信号处理》 CSCD 北大核心 2019年第3期419-425,共7页
考虑到人类视觉系统对图像边缘和局部纹理信息较为敏感,本文提出一种基于特征融合的无参考屏幕图像质量评价方法。所提方法通过梯度方向直方图和局部二值模式分别提取屏幕图像的边缘和局部纹理信息,接着通过特征融合过程得到一个更加能... 考虑到人类视觉系统对图像边缘和局部纹理信息较为敏感,本文提出一种基于特征融合的无参考屏幕图像质量评价方法。所提方法通过梯度方向直方图和局部二值模式分别提取屏幕图像的边缘和局部纹理信息,接着通过特征融合过程得到一个更加能够描述屏幕失真的融合特征,最后采用支持向量回归训练得到屏幕图像融合特征向量与主观质量分数的质量评价映射模型。实验结果显示,与现有的图像质量评价方法相比,本文所提算法能够更好地反映出人类视觉系统对屏幕图像的主观感知度。 展开更多
关键词 屏幕图像 图像质量评价 边缘信息 局部纹理 特征融合
下载PDF
基于结构张量的H.266帧内预测快速算法
18
作者 李鸿辉 曾焕强 +2 位作者 陈婧 朱建清 蔡灿辉 《信号处理》 CSCD 北大核心 2021年第8期1518-1524,共7页
新一代视频编码标准H.266将帧内预测模式从35种扩展到67种,提高预测准确率的同时大大增加了编码的计算复杂度。本文根据视频内容纹理方向和帧内预测模式选择相关性强的特点提出了一种基于结构张量的H.266帧内预测模式快速选择算法,以编... 新一代视频编码标准H.266将帧内预测模式从35种扩展到67种,提高预测准确率的同时大大增加了编码的计算复杂度。本文根据视频内容纹理方向和帧内预测模式选择相关性强的特点提出了一种基于结构张量的H.266帧内预测模式快速选择算法,以编码单元CU为单位,计算其结构张量矩阵,再依据结构张量奇异值分解后得到的特征向量来确定当前CU的纹理方向,缩小候选模式的选择范围,减少进行代价计算的模式数量。实验结果表明,在全I帧条件下,该算法相较于H.266 VTM-7.3标准平台在节省17.28%编码时间的同时只增加1.12%的码率,有效地降低了编码复杂度。 展开更多
关键词 H.266 视频编码 结构张量 帧内预测
下载PDF
基于多视点伪序列的光场图像压缩 被引量:3
19
作者 马晓辉 曾焕强 +2 位作者 陈婧 朱建清 蔡灿辉 《信号处理》 CSCD 北大核心 2019年第3期378-385,共8页
近年来,作为一种能够提供更富有沉浸感的多媒体媒质,光场图像(Light Field Image,LFI)引起广泛的关注。针对光场图像数据量巨大的问题,本文提出了一种基于多视点伪序列的光场图像高效压缩方案。在编码端,所提方法首先将光场相机捕获得... 近年来,作为一种能够提供更富有沉浸感的多媒体媒质,光场图像(Light Field Image,LFI)引起广泛的关注。针对光场图像数据量巨大的问题,本文提出了一种基于多视点伪序列的光场图像高效压缩方案。在编码端,所提方法首先将光场相机捕获得到的原始光场图像根据相机的微透镜阵列分解成子孔径图像。接着根据子孔径图像存在较强视点内和视点间相关性,选取部分子孔径图像进行多视点伪序列构建,基于MV-HEVC设计适用于多视点伪序列的预测编码结构进行编码。在解码端,所提方法基于已解码多视点伪序列通过视频帧插值方法重建出未编码传输的子孔径视图,从而重建出全部光场图像。实验结果表明本文所提算法优于现有基于视差引导稀疏编码的光场图像压缩方法,BD-rate平均节约18.5%,BD-PSNR平均提高1.28 dB。 展开更多
关键词 光场图像 图像压缩 多视点伪序列 预测结构
下载PDF
结合内容特性与纹理类型的HEVC-SCC帧内预测快速算法 被引量:2
20
作者 欧健珊 陈婧 +2 位作者 曾焕强 朱建清 蔡灿辉 《信号处理》 CSCD 北大核心 2020年第3期382-388,共7页
本文提出了一种结合内容特性与纹理类型的HEVC-SCC帧内预测快速算法。利用自然内容和屏幕内容视频DCT变换后系数能量分布不同的特点,结合当前预测单元(Prediction Unit,PU)梯度信息,将编码树单元(Coding Tree Unit,CTU)分成自然内容CTU... 本文提出了一种结合内容特性与纹理类型的HEVC-SCC帧内预测快速算法。利用自然内容和屏幕内容视频DCT变换后系数能量分布不同的特点,结合当前预测单元(Prediction Unit,PU)梯度信息,将编码树单元(Coding Tree Unit,CTU)分成自然内容CTU,简单屏幕内容CTU和复杂屏幕内容CTU。对于自然内容CTU,选择35种传统帧内模式作为候选模式,跳过帧内块复制(Intra Block Copy,IBC)和调色板(Palette mode,PLT)模式;对于简单屏幕内容CTU,选择DC,PLANAR,水平和垂直模式作为候选模式,跳过IBC和PLT模式;对于复杂屏幕内容CTU,选择IBC和PLT模式,跳过其他候选模式。实验结果表明,在全I帧条件下,该算法相较于SCM- 8.3可以节省38.55%的编码时间,大幅度降低了编码复杂度的同时只增加了1.82%的码率。 展开更多
关键词 屏幕内容编码 高效视频编码(HEVC) 帧内预测 模式决策
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部