期刊文献+

《中国图象图形学报》 CSCD 北大核心

作品数5142被引量29430H指数53
《中国图象图形学报》是由中国科学院空天信息创新研究院;中国图象图形学学会;北京应用物理与计算数学研究所创办,是集计算机图像图形高科技理论、技术方法与应用研究成果产业化于一体的综合性学术期刊。 ...查看详情>>
  • 曾用名 中国图象图形学报(A辑)
  • 主办单位中国科学院空天信息创新研究院;中国图象图形学学会;北京应用物理与计算数学研究所
  • 国际标准连续出版物号1006-8961
  • 国内统一连续出版物号11-3758/TB
  • 出版周期月刊
共找到5,142篇文章
< 1 2 250 >
每页显示 20 50 100
室内场景拟人交互研究进展
1
作者 杜韬 胡瑞珍 +2 位作者 刘利斌 弋力 赵昊 《中国图象图形学报》 CSCD 北大核心 2024年第6期1575-1606,共32页
人类智能是在与环境交互中进化的,因而如何实现智能体与环境的自主交互是推进智能演化的关键。环境自主交互是一项涉及计算机图形学、计算机视觉和机器人等多个学科领域的研究课题,引起广泛的关注和探究,学术界已围绕这一热点研究问题... 人类智能是在与环境交互中进化的,因而如何实现智能体与环境的自主交互是推进智能演化的关键。环境自主交互是一项涉及计算机图形学、计算机视觉和机器人等多个学科领域的研究课题,引起广泛的关注和探究,学术界已围绕这一热点研究问题从不同视角和技术维度开展了一系列研究工作。本文着眼于室内场景拟人交互,全面梳理数字人与机器人在室内环境下学习完成特定交互任务过程中需要涉及的仿真交互平台、场景交互数据和交互生成算法3方面基本要素的研究进展。在仿真交互环境搭建方面,本文梳理了仿真环境涉及的仿真技术和研究进展,并对代表性的拟人交互仿真平台进行了介绍;在场景交互数据构建方面,本文从场景交互感知数据集、场景交互运动数据集以及交互数据规模的高效扩充3方面对国内外研究现状进行了详细介绍;在拟人交互感知与生成方面,本文介绍了以交互为导向的场景可供性分析的相关工作,并以交互生成为线索,分别梳理了数字人—场景交互生成、机器人—场景交互生成的相关工作。基于对国内外相关工作的梳理和讨论,最后从交互仿真、交互数据、交互感知和交互生成4个方面,总结了该领域目前仍面临的挑战,并对未来的发展趋势进行了展望。 展开更多
关键词 环境交互 交互仿真 交互数据 交互感知 交互生成
原文传递
小股人群重识别研究进展
2
作者 张权 赖剑煌 +1 位作者 谢晓华 陈泓栩 《中国图象图形学报》 CSCD 北大核心 2023年第5期1225-1241,共17页
小股人群重识别旨在将非重叠视域的摄像头网络下具有相同成员的群组图像进行正确的关联。小股人群重识别是传统行人重识别任务的一个重要拓展,在安防监控场景下有着重要的研究意义和应用前景。小股人群重识别所面临的独特挑战在于如何... 小股人群重识别旨在将非重叠视域的摄像头网络下具有相同成员的群组图像进行正确的关联。小股人群重识别是传统行人重识别任务的一个重要拓展,在安防监控场景下有着重要的研究意义和应用前景。小股人群重识别所面临的独特挑战在于如何针对群内成员的数量变化和布局变化进行建模,并提取稳定、鲁棒的特征表达。近年来,小股人群重识别引发了研究人员的广泛关注,并获得了快速的发展。本文对小股人群重识别技术的研究进展进行了全面的梳理回顾。首先简要介绍本领域的研究背景,对基本概念、数据集和相关技术进行了简要总结。在此基础上,对多种小股人群重识别算法进行了详细的介绍,并在多个数据集上对前沿算法进行性能对比。最后,对该任务进行展望。整体而言,与行人重识别相比,小股人群重识别的现有方法在具体场景下的特定挑战性能表现欠佳,还需要从数据收集和方法设计两方面进一步探讨。此外,现有的小股人群重识别研究与其他视觉任务的关联性不够紧密,如何协同多任务作业以解决更多业界需求、加速产业落地,需要学术界和工业界共同思考和推动。 展开更多
关键词 小股人群重识别(GReID) 行人重识别 虚拟数据 深度学习 特征学习 度量学习 TRANSFORMER
原文传递
面向全景智齿检测的内卷解耦轻量化网络
3
作者 曾怡峰 姚潇 +2 位作者 华飞 王佩佩 顾敏 《中国图象图形学报》 CSCD 北大核心 2023年第8期2491-2504,共14页
目的全口曲面断层片(全景片)需要病人的正确摆位辅以仪器的合理配置而取得合格的成像:以面中线为界,双侧上下颌骨等结构呈左右对称;牙齿的咬合面连线呈缓慢的微笑曲线,各牙齿在全景片上的生理位置是基本固定的。因此,以全景片为代表的... 目的全口曲面断层片(全景片)需要病人的正确摆位辅以仪器的合理配置而取得合格的成像:以面中线为界,双侧上下颌骨等结构呈左右对称;牙齿的咬合面连线呈缓慢的微笑曲线,各牙齿在全景片上的生理位置是基本固定的。因此,以全景片为代表的口腔医学图像具备固定的前、背景关系和稳定的空间结构,但基于常规卷积的网络因其卷积的空间无关性而对上述空间域的结构信息并不敏感。虽然一些特殊的注意力模块能够引导模型关注特定信息并给予加权,但是它关注的信息常常背离人们的期望,反而降低模型性能;另一方面,注意力作为嵌入式的模块往往会提高计算量和参数量。针对口腔医学图像的结构特性,提出适用于全景智齿检测的基于内卷解耦的YOLO(you only look once)模型。方法在主干网络中,通过重塑跨阶段分部(cross stage partial,CSP)结构并引入一种具备空间特异性的内卷积方式,使模型优先关注空间域中信息量最大的视觉元素,以此强化模型对空间信息的建模能力;在检测头结构中,提出采用多支路解耦结构克服任务耦合的负面影响,解决内卷算子与YOLO模型的适配性问题,并对各支路的损失函数进行针对性优化。结果在全景片数据集上的智齿检测的实验结果表明,本文方法的检测性能和模型参数大幅优于近年优秀的单阶段目标检测模型,相较于本文的基线模型,参数量缩减了42.5%,平均精确率提升了6.3%,充分验证了本文模型结构的合理性及对于智齿检测任务的有效性。结论本文针对口腔医学图像的空间结构性质提出的基于内卷解耦的全景智齿检测方案,具有更强的空间信息建模能力,且降低了参数量成本。 展开更多
关键词 全景片 智齿 目标检测 YOLO 解耦 内卷
原文传递
结合部首字形和层级结构的手写汉字纠错方法 被引量:2
4
作者 李云青 杜俊 +1 位作者 胡鹏飞 张建树 《中国图象图形学报》 CSCD 北大核心 2023年第8期2382-2395,共14页
目的手写汉字纠错(handwritten Chinese character error correction,HCCEC)任务具有两重性,即判断汉字正确性和对错字进行纠正,该任务在教育场景下应用广泛,可以帮助学生学习汉字、纠正书写错误。由于手写汉字具有复杂的空间结构、多... 目的手写汉字纠错(handwritten Chinese character error correction,HCCEC)任务具有两重性,即判断汉字正确性和对错字进行纠正,该任务在教育场景下应用广泛,可以帮助学生学习汉字、纠正书写错误。由于手写汉字具有复杂的空间结构、多样的书写风格以及巨大的数量,且错字与正确字之间具有高度的相似性,因此,手写汉字纠错的关键是如何精确地建模一个汉字。为此,提出一种层级部首网络(hierarchical radical network,HRN)。方法从部首字形的角度出发,挖掘部首形状结构上的相似性,通过注意力模块捕获包含部首信息的细粒度图像特征,增大相似字之间的区分性。另外,结合汉字本身的层级结构特性,采用基于概率解码的思路,对部首的层级位置进行建模。结果在手写汉字数据集上进行实验,与现有方案相比,HRN在正确字测试集与错字测试集上,精确率分别提升了0.5%和9.8%,修正率在错字测试集上提升了15.3%。此外,通过注意力机制的可视化分析,验证了HRN可以捕捉包含部首信息的细粒度图像特征。部首表征之间的欧氏距离证明了HRN学习到的部首表征向量中包含了部首的字形结构信息。结论本文提出的HRN能够更好地对相似部首进行区分,进而精确地区分正确字与错字,具有很强的鲁棒性和泛化性。 展开更多
关键词 手写汉字纠错(HCCEC) 汉字识别 部首分析 广义零样本学习(GZSL) 注意力机制 卷积神经网络(CNN)
原文传递
基于深度学习的图像融合方法综述 被引量:26
5
作者 唐霖峰 张浩 +1 位作者 徐涵 马佳义 《中国图象图形学报》 CSCD 北大核心 2023年第1期3-36,共34页
图像融合技术旨在将不同源图像中的互补信息整合到单幅融合图像中以全面表征成像场景,并促进后续的视觉任务。随着深度学习的兴起,基于深度学习的图像融合算法如雨后春笋般涌现,特别是自编码器、生成对抗网络以及Transformer等技术的出... 图像融合技术旨在将不同源图像中的互补信息整合到单幅融合图像中以全面表征成像场景,并促进后续的视觉任务。随着深度学习的兴起,基于深度学习的图像融合算法如雨后春笋般涌现,特别是自编码器、生成对抗网络以及Transformer等技术的出现使图像融合性能产生了质的飞跃。本文对不同融合任务场景下的前沿深度融合算法进行全面论述和分析。首先,介绍图像融合的基本概念以及不同融合场景的定义。针对多模图像融合、数字摄影图像融合以及遥感影像融合等不同的融合场景,从网络架构和监督范式等角度全面阐述各类方法的基本思想,并讨论各类方法的特点。其次,总结各类算法的局限性,并给出进一步的改进方向。再次,简要介绍不同融合场景中常用的数据集,并给出各种评估指标的具体定义。对于每一种融合任务,从定性评估、定量评估和运行效率等多角度全面比较其中代表性算法的性能。本文提及的算法、数据集和评估指标已汇总至https://github.com/Linfeng-Tang/Image-Fusion。最后,给出了本文结论以及图像融合研究中存在的一些严峻挑战,并对未来可能的研究方向进行了展望。 展开更多
关键词 图像融合 深度学习 多模图像 数字摄影 遥感影像
原文传递
双视图三维卷积网络的工业装箱行为识别 被引量:1
6
作者 胡海洋 潘健 李忠金 《中国图象图形学报》 CSCD 北大核心 2022年第8期2368-2379,共12页
目的 在自动化、智能化的现代生产制造过程中,行为识别技术扮演着越来越重要的角色,但实际生产制造环境的复杂性,使其成为一项具有挑战性的任务。目前,基于3D卷积网络结合光流的方法在行为识别方面表现出良好的性能,但还是不能很好地解... 目的 在自动化、智能化的现代生产制造过程中,行为识别技术扮演着越来越重要的角色,但实际生产制造环境的复杂性,使其成为一项具有挑战性的任务。目前,基于3D卷积网络结合光流的方法在行为识别方面表现出良好的性能,但还是不能很好地解决人体被遮挡的问题,而且光流的计算成本很高,无法在实时场景中应用。针对实际工业装箱场景中存在的人体被遮挡问题和光流计算成本问题,本文提出一种结合双视图3D卷积网络的装箱行为识别方法。方法 首先,通过使用堆叠的差分图像(residual frames, RF)作为模型的输入来更好地提取运动特征,替代实时场景中无法使用的光流。原始RGB图像和差分图像分别输入到两个并行的3D ResNeXt101中。其次,采用双视图结构来解决人体被遮挡的问题,将3D ResNeXt101优化为双视图模型,使用一个可学习权重的双视图池化层对不同角度的视图做特征融合,然后使用该双视图3D ResNeXt101模型进行行为识别。最后,为进一步提高检测结果的真负率(true negative rate, TNR),本文在模型中加入降噪自编码器和two-class支持向量机(support vector machine, SVM)。结果 本文在实际生产环境下装箱场景进行了实验,采用准确率和真负率两个指标进行评估,得到的装箱行为识别准确率为94.2%、真负率为98.9%。同时在公共数据集UCF(University of Central Florida)101上进行了评估,以准确率为评估指标,得到的装箱行为识别准确率为97.9%。进一步验证了本文方法的有效性和准确性。结论 本文提出的人体行为识别方法能够有效利用多个视图中的人体行为信息,结合传统模型和深度学习模型,显著提高了行为识别准确率和真负率。 展开更多
关键词 行为识别 双视图 三维卷积神经网络 降噪自编码器 支持向量机(SVM)
原文传递
用于单幅模糊图像超分辨的Transformer融合网络 被引量:5
7
作者 刘花成 任文琦 +1 位作者 王蕊 操晓春 《中国图象图形学报》 CSCD 北大核心 2022年第5期1616-1631,共16页
目的以卷积神经网络为代表的深度学习方法已经在单帧图像超分辨领域取得了丰硕成果,这些方法大多假设低分辨图像不存在模糊效应。然而,由于相机抖动、物体运动等原因,真实场景下的低分辨率图像通常会伴随着模糊现象。因此,为了解决模糊... 目的以卷积神经网络为代表的深度学习方法已经在单帧图像超分辨领域取得了丰硕成果,这些方法大多假设低分辨图像不存在模糊效应。然而,由于相机抖动、物体运动等原因,真实场景下的低分辨率图像通常会伴随着模糊现象。因此,为了解决模糊图像的超分辨问题,提出了一种新颖的Transformer融合网络。方法首先使用去模糊模块和细节纹理特征提取模块分别提取清晰边缘轮廓特征和细节纹理特征。然后,通过多头自注意力机制计算特征图任一局部信息对于全局信息的响应,从而使Transformer融合模块对边缘特征和纹理特征进行全局语义级的特征融合。最后,通过一个高清图像重建模块将融合特征恢复成高分辨率图像。结果实验在2个公开数据集上与最新的9种方法进行了比较,在GOPRO数据集上进行2倍、4倍、8倍超分辨重建,相比于性能第2的模型GFN(gated fusion network),峰值信噪比(peak signal-to-noive ratio,PSNR)分别提高了0.12 d B、0.18 d B、0.07 d B;在Kohler数据集上进行2倍、4倍、8倍超分辨重建,相比于性能第2的模型GFN,PSNR值分别提高了0.17 d B、0.28 d B、0.16 d B。同时也在GOPRO数据集上进行了对比实验以验证Transformer融合网络的有效性。对比实验结果表明,提出的网络明显提升了对模糊图像超分辨重建的效果。结论本文所提出的用于模糊图像超分辨的Transformer融合网络,具有优异的长程依赖关系和全局信息捕捉能力,其通过多头自注意力层计算特征图任一局部信息在全局信息上的响应,实现了对去模糊特征和细节纹理特征在全局语义层次的深度融合,从而提升了对模糊图像进行超分辨重建的效果。 展开更多
关键词 超分辨 单帧图像超分辨 模糊图像 融合网络 TRANSFORMER
原文传递
一尺窗 一世界 2020年封面图片
8
《中国图象图形学报》 CSCD 北大核心 2021年第5期F0004-F0004,共1页
原文传递
多视角神经网络非接触式脉搏信号提取 被引量:1
9
作者 赵昶辰 居峰 冯远静 《中国图象图形学报》 CSCD 北大核心 2020年第11期2428-2438,共11页
目的远程光体积描记(remote photoplethysmography,r PPG)是一种基于视频的非接触式心率测量技术,受到学者的广泛关注。从视频数据中提取脉搏信号需要同时考虑时间和空间信息,然而现有方法往往将空间处理与时间处理割裂开,从而造成建模... 目的远程光体积描记(remote photoplethysmography,r PPG)是一种基于视频的非接触式心率测量技术,受到学者的广泛关注。从视频数据中提取脉搏信号需要同时考虑时间和空间信息,然而现有方法往往将空间处理与时间处理割裂开,从而造成建模不准确、测量精度不高等问题。本文提出一种基于多视角2维卷积的神经网络模型,对帧内和帧间相关性进行建模,从而提高测量精度。方法所提网络包括普通2维卷积块和多视角卷积块。普通2维卷积块将输入数据在空间维度做初步抽象。多视角卷积块包括3个通道,分别从输入数据的高—宽、高—时间、宽—时间3个视角进行2维卷积操作,再将3个视角的互补时空特征进行融合得到最终的脉搏信号。所提多视角2维卷积是对传统单视角2维卷积网络在时间维度的扩展。该方法不破坏视频原有结构,通过3个视角的卷积操作挖掘时空互补特征,从而提高脉搏测量精度。结果在公共数据集PURE(pulse rate detection dataset)和自建数据集Self-rPPG(self-built r PPG dataset)上的实验结果表明,所提网络提取脉搏信号的信噪比相比于传统方法在两个数据集上分别提高了3.92 d B和1.92 d B,平均绝对误差分别降低了3.81 bpm和2.91 bpm;信噪比相比于单视角网络分别提高了2.93 d B和3.20 d B,平均绝对误差分别降低了2.20 bpm和3.61 bpm。结论所提网络能够在复杂环境中以较高精度估计出受试者的脉搏信号,表明了多视角2维卷积在r PPG脉搏提取的有效性。与基于单视角2维神经网络的r PPG算法相比,本文方法提取的脉搏信号噪声、低频分量更少,泛化能力更强。 展开更多
关键词 心率测量 神经网络 远程光体积描记(r PPG) 多视角卷积 时空特征
原文传递
突变策略下多通路Metropolis光照传播
10
作者 贺怀清 赵煜桢 +1 位作者 刘浩翰 王旭 《中国图象图形学报》 CSCD 北大核心 2020年第8期1658-1673,共16页
目的针对多通路Metropolis光照传播(multiplexed Metropolis light transport,MMLT)算法在亮度不均匀区域接受概率低、采样数量与光照分布不对称以及亮度均匀区域样本流动性差的问题,提出一种兼顾整体和局部处理的融合突变策略。方法整... 目的针对多通路Metropolis光照传播(multiplexed Metropolis light transport,MMLT)算法在亮度不均匀区域接受概率低、采样数量与光照分布不对称以及亮度均匀区域样本流动性差的问题,提出一种兼顾整体和局部处理的融合突变策略。方法整体上,以方差动态度量像素平面亮度均匀度,并自适应调整采样步长,记录每个像素位置的采样数量,当采样进行到当前采样像素的样本数量达到阈值,且当前样本是马尔可夫链起始样本或大突变后首个样本时,以方差度量当前采样像素及其8邻域范围内亮度均匀程度,并以方差的计算结果调整当前马尔可夫链的采样步长。若当前采样像素的样本数量达到阈值,且当前样本是马尔可夫链小突变时,则兼顾采样数量和光照强度计算当前像素8邻域内的采样权重。结果实验将改进算法和MMLT算法在不同光照和材质的场景下进行对比,改进算法在保证高光区域渲染效果外,使亮度不均匀区域的渲染结果更加细腻,亮度均匀区域样本更为分散。结论本文提出以方差动态度量图像亮度均匀度,自适应调整采样步长与加强高光区域采样相结合的融合突变策略,可以使样本在亮度不均匀区域聚集进行精细采样,在亮度变化剧烈处改善局部采样数量与光照分布不对称现象,在亮度均匀区域增强样本的遍历性。 展开更多
关键词 融合突变策略 多通路Metropolis 采样步长 接受概率 方差 亮度均匀度
原文传递
多级卷积特征金字塔的细粒度食物图片识别 被引量:7
11
作者 梁华刚 温晓倩 +2 位作者 梁丹丹 李怀德 茹锋 《中国图象图形学报》 CSCD 北大核心 2019年第6期870-881,共12页
目的食物图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,比普通细粒度图片的识别难度更大。目前在食物图片识别领域,食物图片的识别与分类仍存在精度低、泛化性差等问题。为了提高食物图片的识别与分类精度,充分利用食... 目的食物图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,比普通细粒度图片的识别难度更大。目前在食物图片识别领域,食物图片的识别与分类仍存在精度低、泛化性差等问题。为了提高食物图片的识别与分类精度,充分利用食物图片的全局与局部细节信息,本文提出了一个多级卷积特征金字塔的细粒度食物图片识别模型。方法本文模型从整体到局部逐级提取特征,将干扰较大的背景信息丢弃,仅针对食物目标区域提取特征。模型主要由食物特征提取网络、注意力区域定位网络和特征融合网格3部分组成,并采用3级食物特征提取网络的级联结构来实现特征由全局到局部的转移。此外,针对食物图片尺度变化大的特点,本文模型在每级食物特征提取网络中加入了特征金字塔结构,提高了模型对目标大小的鲁棒性。结果本文模型在目前主流公开的食物图片数据集Food-101、Chinese Food Net和Food-172上进行实验,分别获得了91.4%、82.8%、90.3%的Top-1正确率,与现有方法相比提高了1%~8%。结论本文提出了一种多级卷积神经网络食物图片识别模型,可以自动定位食物图片区分度较大的区域,融合食物图片的全局与局部特征,实现了食物图片的细粒度识别,有效提高了食物图片的识别精度。实验结果表明,该模型在目前主流食物图片数据集上取得了最好的结果。 展开更多
关键词 食物图片识别 卷积神经网络 注意力网络 细粒度识别 特征金字塔
原文传递
面向人脸图像发布的差分隐私保护 被引量:5
12
作者 张啸剑 付聪聪 孟小峰 《中国图象图形学报》 CSCD 北大核心 2018年第9期1305-1315,共11页
目的由于人脸图像蕴含着丰富的个人敏感信息,直接发布出来可能会造成个人的隐私泄露。为了保护人脸图像中的隐私信息,本文提出了一种基于傅里叶变换与差分隐私技术相结合的人脸图像发布方法 FIP(facial image publication)。方法将人脸... 目的由于人脸图像蕴含着丰富的个人敏感信息,直接发布出来可能会造成个人的隐私泄露。为了保护人脸图像中的隐私信息,本文提出了一种基于傅里叶变换与差分隐私技术相结合的人脸图像发布方法 FIP(facial image publication)。方法将人脸图像作为实数域2维矩阵,充分利用离散傅里叶变换技术压缩图像。为了有效均衡由拉普拉斯机制引起的噪音误差以及由傅里叶变换导致的重构误差,引入一种基于指数机制的傅里叶系数选择方法 EMK(exponential mechanism-based k coefficients sampling),它能够在不同的系数空间中挑选出合理的傅里叶系数来压缩人脸图像,然后利用拉普拉斯机制对所挑选出的系数添加噪音,进而使整个处理过程满足ε-差分隐私。此外,为了避免较大的傅里叶系数空间导致指数机制挑选系数不准确问题,基于离散实数傅里叶变换的共轭对称特性,提出了一种增强的指数机制挑选傅里叶系数方法 BEMK(boosted exponential mechanism-based k coefficients sampling),该方法不仅进一步压缩离散傅里叶系数空间,而且还能够提高人脸图像发布的精度。结果基于4种真实人脸图像数据集采用支持向量机分类与采用主成分分析技术验证方法的正确性。从算法的准确率、召回率,以及F1-Score度量结果显示,提出的基于离散傅里叶变换技术的人脸图像发布方法均优于直接采用拉普拉斯机制的发布方法 LAP(Laplace mechanism-based publication)。结论实验结果表明,本文方法能够实现满足ε-差分隐私的敏感人脸图像发布,图像分类验证其具有较高的可用性。特别是BEMK方法具有较好的鲁棒性,是一种有效的隐私人脸图像发布方法。 展开更多
关键词 人脸图像处理 隐私保护 差分隐私 傅里叶变换
原文传递
热带气旋客观定位的红外亮温方差方法 被引量:4
13
作者 张长江 薛利成 +1 位作者 马雷鸣 鲁小琴 《中国图象图形学报》 CSCD 北大核心 2018年第3期450-457,共8页
目的热带气旋(TC)是生成于热带或副热带洋面上的强烈天气系统。在TC的监测分析和预报工作中,准确地确定其中心实时地理位置至关重要。此外,TC的精确位置也是TC强度估计的重要参数。对此,提出一种利用偏差角方差定位TC中心的方法。方法首... 目的热带气旋(TC)是生成于热带或副热带洋面上的强烈天气系统。在TC的监测分析和预报工作中,准确地确定其中心实时地理位置至关重要。此外,TC的精确位置也是TC强度估计的重要参数。对此,提出一种利用偏差角方差定位TC中心的方法。方法首先,从红外卫星云图中截取热带气旋主体云系区域,并分别利用Bezier直方图和K均值聚类方法分割得到主体云系二值图像和红外亮温变化剧烈位置二值图像。其中,主体云系二值图像可将TC的主体云系从卫星红外云图中分割提取出来,用割提取出来的图像进行定位可以剔除掉外散环流的小云块对定位结果的影响;而红外亮温变化剧烈位置二值图像则可分别将TC中心密闭云区,螺旋云带和外散环流的边缘及梯度较大区域分割出来,这些区域是最后TC中心定位的主要依据。将上述两幅二值图像相与得到气旋主体云系红外亮温变化剧烈位置的二值图像,这一步剔除了TC的外散环流,而得到的二值图像便可分别将TC中心密闭云区和螺旋云带的边缘及梯度较大的区域分割出来。然后,对得到的气旋主体云系红外亮温变化剧烈位置二值图像进行Hough变换检测以减小气旋中心的搜索范围。最后,以检测区域内每个像素点为参考中心计算得到偏差角矩阵,并计算偏差角矩阵的方差填入对应检测区域内作为参考中心像素点的位置得到方差矩阵,将方差矩阵中值最小的位置作为气旋中心。因为TC除了少数特别强的时候大多数可以用圆形描述,而绝大多数时候TC要用螺旋线描述,但是具体是几度螺旋线来描述合适很难确定,本文用偏差角的方差就可以衡量这些云带、边缘的偏离状况是否集中,方差越小就表示偏离状况越集中。结果运用该方法对400幅无眼TC红外图像和197幅有眼TC红外图像进行中心定位,分别与中国气象局(CMA)、日本气象厅(JMA)和美国台风预警中心(JTWC)的主观定位结果进行比较并取平均偏差,本文方法对有眼TC定位平均偏差约为27 km,无眼TC平均偏差约为45 km。具体到分别与CMA、JMA和JTWC的比较,对于有眼TC定位偏差分别为26.82 km,26.05 km和27.84 km,无眼TC定位偏差为45.84 km,44.84 km和47.15 km。结论就结果而言,本文方法定位与CMA、JMA的偏差比较接近,与JTWC的偏差较大。就西北太平洋的TC而言,CMA和JMA的定位精度较高,JTWC精度稍低,这是与认知相符合,并且也证明了本文方法具有较高的可信度。此外,本文方法为TC定位提供了新的参考依据。 展开更多
关键词 偏差角方差 Bezier直方图分割 K均值聚类分割 HOUGH变换
原文传递
构建近邻上下文的拷贝图像检索 被引量:2
14
作者 杨醒龙 姚金良 +1 位作者 王小华 方小飞 《中国图象图形学报》 CSCD 北大核心 2017年第8期1098-1105,共8页
目的以词袋模型为基础的拷贝图像检索方法是当前最有效的方法。然而,由于局部特征量化存在信息损失,导致视觉词汇区别能力不足和视觉词汇误匹配增加,从而影响了拷贝图像检索效果。针对视觉词汇的误匹配问题,提出一种基于近邻上下文的拷... 目的以词袋模型为基础的拷贝图像检索方法是当前最有效的方法。然而,由于局部特征量化存在信息损失,导致视觉词汇区别能力不足和视觉词汇误匹配增加,从而影响了拷贝图像检索效果。针对视觉词汇的误匹配问题,提出一种基于近邻上下文的拷贝图像检索方法。该方法通过局部特征的上下文关系消除视觉词汇歧义,提高视觉词汇的区分度,进而提高拷贝图像的检索效果。方法首先,以距离和尺度关系选择图像中某局部特征点周围的特征点作为该特征点的上下文,选取的上下文中的局部特征点称为近邻特征点;再以近邻特征点的信息以及与该局部特征的关系为该局部特征构建上下文描述子;然后,通过计算上下文描述子的相似性对局部特征匹配对进行验证;最后,以正确匹配特征点的个数衡量图像间的相似性,并以此相似性选取若干候选图像作为返回结果。结果在Copydays图像库进行实验,与Baseline方法进行比较。在干扰图像规模为100 k时,相对于Baseline方法,m AP提高了63%。当干扰图像规模从100 k增加到1 M时,Baseline的m AP值下降9%,而本文方法下降3%。结论本文拷贝图像检索方法对图像编辑操作,如旋转、图像叠加、尺度变换以及裁剪有较高的鲁棒性。该方法可以有效地应用到图像防伪、图像去重等领域。 展开更多
关键词 局部特征 视觉词汇 拷贝图像检索 词袋模型 图像检索
原文传递
面向水下图像的质量评价方法 被引量:13
15
作者 郭继昌 李重仪 +1 位作者 张艳 顾翔元 《中国图象图形学报》 CSCD 北大核心 2017年第1期1-8,共8页
目的针对目前水下图像质量评价方法少和现有方法存在局限性等问题,提出一种无参考并且无需手工设计特征的水下图像质量评价方法。方法提出的水下图像质量评价方法将深度学习网络框架与随机森林回归模型相结合,首先采用深度神经网络提取... 目的针对目前水下图像质量评价方法少和现有方法存在局限性等问题,提出一种无参考并且无需手工设计特征的水下图像质量评价方法。方法提出的水下图像质量评价方法将深度学习网络框架与随机森林回归模型相结合,首先采用深度神经网络提取水下图像的特征;然后使用提取的特征和标定的水下图像质量分数训练回归模型;最终,利用训练好的回归模型预测水下图像的质量。结果在本文收集的水下图像数据集和水下图像清晰化算法处理结果上评测本文方法,并与多种质量评价方法进行比较,其中包括预测结果与主观质量分数比较、水下图像清晰化结果评测比较、预测结果与主观质量分数相关性比较、鲁棒性比较等。主观实验结果表明本文的评价方法可以相对准确地给出符合人类视觉感知的水下图像质量分数,并且具有更好的鲁棒性。定量实验结果表明本文方法与其他方法相比,预测的图像质量分数与主观分数具有更高的相关性。结论提出的水下图像质量评价方法无需参考图像,省去了手工设计的特征,充分利用了深度学习网络的学习和表征能力。本文方法的准确性较好,普适性和鲁棒性较高,预测的质量分数与人类视觉感知具有较高的一致性。本方法适用于原始的水下图像和水下图像清晰化算法的处理结果。 展开更多
关键词 水下图像 无参考图像质量评价 深度学习 人类视觉感知 水下图像清晰化
原文传递
混沌映射与比特重组的图像加密 被引量:9
16
作者 平萍 李健华 +1 位作者 毛莺池 戚荣志 《中国图象图形学报》 CSCD 北大核心 2017年第10期1348-1355,共8页
目的当前很多图像加密都采用基于比特的加密算法。针对这种比较流行的加密算法所存在的安全缺陷问题,提出一种能够解决比特面0比特和1比特置乱时的位置限制的图像加密算法,实现比特的全局重组。方法首先利用Tent混沌映射生成一个伪随机... 目的当前很多图像加密都采用基于比特的加密算法。针对这种比较流行的加密算法所存在的安全缺陷问题,提出一种能够解决比特面0比特和1比特置乱时的位置限制的图像加密算法,实现比特的全局重组。方法首先利用Tent混沌映射生成一个伪随机序列,然后利用生成的伪随机序列对比特明文图像进行整行以及整列的置乱,将置乱后的比特像素矩阵分块分别进行Henon映射的置乱,最后经过扩散操作得到最后的密文图像。结果加密后明文图像的像素值的分布由不均匀变成了均匀分布,明文图像的各像素间的相关性被打破,使得原图没有了统计特性,像素变化率(NPCR)以及归一化平均变化强度(UACI)皆接近理想值,算法能够抵抗穷举攻击和差分攻击,并且在能保证加密安全的同时能有较低计算复杂度。结论本文所提出的图像加密算法具有加密后像素相关性低、密钥空间大,以及对明文图像和密钥高度敏感等特点,本文算法在进行比特级的置乱时,又加入了与明文相关的特性,增强了加密算法的明文敏感性,同时也加强了加密算法的扩散性,可有效地保障密文图像的安全。 展开更多
关键词 图像加密 HENON映射 比特重组 全局置乱 混沌系统
原文传递
光场成像技术及其在计算机视觉中的应用 被引量:14
17
作者 张驰 刘菲 +2 位作者 侯广琦 孙哲南 谭铁牛 《中国图象图形学报》 CSCD 北大核心 2016年第3期263-281,共19页
目的光场成像技术刚刚在计算机视觉研究中展开初步应用,其相关研究比较零散,缺乏系统性。本文旨在系统介绍光场成像技术发展以及其应用在计算机视觉研究中有代表性的工作。方法从解决计算机视觉问题的角度出发,4个层面讨论光场成像技术... 目的光场成像技术刚刚在计算机视觉研究中展开初步应用,其相关研究比较零散,缺乏系统性。本文旨在系统介绍光场成像技术发展以及其应用在计算机视觉研究中有代表性的工作。方法从解决计算机视觉问题的角度出发,4个层面讨论光场成像技术最近十年的研究工作,包括:1)主流的光场成像设备及其作为计算机视觉传感器的优点与不足;2)光场相机作为视觉传感器的标定、解码以及预处理方法;3)基于4维光场的图像渲染与重建技术,以及其如何促进计算机视觉研究;4)以4维光场数据为基础的特征表达方法。结果逐层梳理出光场成像在求解视觉问题中的优势和局限,分析其中根本性的原理与掣肘,力图总结出亟待解决的关键问题以及未来的发展趋势。结论作为一种颇具前景的新型计算机视觉传感器技术,光场成像技术的研究必将更为广泛和深入。研究应用于计算机视觉的光场成像技术将有力的引导和促进计算机视觉和光场成像技术协同发展。 展开更多
关键词 光场成像技术 计算机视觉 4维光场 重对焦 深度估计
原文传递
动态背景下的稀疏光流目标提取与跟踪 被引量:11
18
作者 兰红 周伟 齐彦丽 《中国图象图形学报》 CSCD 北大核心 2016年第6期771-780,共10页
目的针对背景和摄像机同时运动情况下的运动目标提取与跟踪,提出一种基于稀疏光流的目标提取与跟踪新方法。方法首先,利用金字塔LK光流法生成光流图像匹配相邻两幅图像的特征点,依据光流图像中的位移、方向等光流信息初步划分背景和前... 目的针对背景和摄像机同时运动情况下的运动目标提取与跟踪,提出一种基于稀疏光流的目标提取与跟踪新方法。方法首先,利用金字塔LK光流法生成光流图像匹配相邻两幅图像的特征点,依据光流图像中的位移、方向等光流信息初步划分背景和前景目标的特征点;然后利用中心迭代法去除不属于目标运动区域的噪声特征点;最后,通过前N帧图像目标特征点的最大交集得到属于目标的稳定特征点并在后续帧中进行跟踪。对于后续跟踪图像中存在的遮挡问题,引入了一个基于特征点的遮挡系数,运用Kalman预估算法得到目标位置的预测,并且在目标重新出现时能够迅速定位目标。结果与已有的光流匹配算法相比,本文算法的目标特征点误检率降低了10%左右,成功跟踪率达到97%;引入预估器使得本文算法对有遮挡运动目标也能够实现准确跟踪和定位。结论本文算法对复杂动态背景下无遮挡和有遮挡的持续运动目标跟踪均具有准确识别定位性能,满足实时要求,适用于缓慢或者快速移动的运动场景目标提取和目标跟踪。 展开更多
关键词 稀疏光流 金字塔LK光流法 光流信息 Kalman预估算法 中心迭代法 动态背景 目标跟踪
原文传递
星载SAR影像上船舶方位向模糊去除算法 被引量:2
19
作者 邴磊 邢前国 +2 位作者 邹娜娜 李圳波 吴樊 《中国图象图形学报》 CSCD 北大核心 2016年第7期951-958,共8页
目的掌握海上船舶分布状态对于海上交通流分析和通航安全管理具有重要作用。遥感技术,特别是星载合成孔径雷达(SAR)技术的发展,为大范围海上船舶检测提供了有效的手段,但受SAR成像机制影响,海上船舶目标在星载SAR影像上通常存在着不同... 目的掌握海上船舶分布状态对于海上交通流分析和通航安全管理具有重要作用。遥感技术,特别是星载合成孔径雷达(SAR)技术的发展,为大范围海上船舶检测提供了有效的手段,但受SAR成像机制影响,海上船舶目标在星载SAR影像上通常存在着不同程度的方位向模糊噪声,这些噪声易被误判为船舶,导致船舶识别中虚警率提高。方法本文简述了方位向模糊噪声的产生原因,提出了一种新的星载SAR影像上船舶方位向模糊去除算法,该算法的核心是构建目标方位向角度一致性、方位向位置偏移距离和方位向模糊能量衰减3个判别规则,对潜在SAR影像亮斑目标进行逐层筛选,实现船舶真实目标和方位向模糊目标的判别。结果选取中国渤海海域和黄海海域的30 m分辨率的Radarsat-2数据进行案例分析,并与船舶自动识别系统(AIS)实测数据进行比对校验,结果表明,传统的双参数恒虚警率(CFAR)算法和基于K分布的CFAR等算法对于船舶难以剔除方位向模糊,容易造成虚警,而本文算法对实验影像的船舶方位向模糊去除准确率优于95.8%,能够有效剔除船舶方位向模糊。结论该算法为星载SAR影像上船舶方位向模糊去除提供了新的手段,有助于提高SAR影像上船舶目标检测的准确性。 展开更多
关键词 船舶检测 方位向模糊 合成孔径雷达(SAR) 船舶自动识别系统(AIS) 遥感 RADARSAT-2
原文传递
利用双通道卷积神经网络的图像超分辨率算法 被引量:18
20
作者 徐冉 张俊格 黄凯奇 《中国图象图形学报》 CSCD 北大核心 2016年第5期556-564,共9页
目的图像超分辨率算法在实际应用中有着较为广泛的需求和研究。然而传统基于样本的超分辨率算法均使用简单的图像梯度特征表征低分辨率图像块,这些特征难以有效地区分不同的低分辨率图像块。针对此问题,在传统基于样本超分辨率算法的基... 目的图像超分辨率算法在实际应用中有着较为广泛的需求和研究。然而传统基于样本的超分辨率算法均使用简单的图像梯度特征表征低分辨率图像块,这些特征难以有效地区分不同的低分辨率图像块。针对此问题,在传统基于样本超分辨率算法的基础上,提出双通道卷积神经网络学习低分辨率与高分辨率图像块相似度进行图像超分辨率的算法。方法首先利用深度卷积神经网络学习得到有效的低分辨率与高分辨率图像块之间相似性度量,然后根据输入低分辨率图像块与高分辨率图像块字典基元的相似度重构出对应的高分辨率图像块。结果本文算法在Set5和Set14数据集上放大3倍情况下分别取得了平均峰值信噪比(PSNR)为32.53 d B与29.17 d B的效果。结论本文算法从低分辨率与高分辨率图像块相似度学习角度解决图像超分辨率问题,可以更好地保持结果图像中的边缘信息,减弱结果中的振铃现象。本文算法可以很好地适用于自然场景图像的超分辨率增强任务。 展开更多
关键词 图像超分辨率 Pair—wise卷积神经网络 双通道卷积神经网络 图像块相似度学习
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部