期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
基于多级语义对齐的图像-文本匹配算法
1
作者 李艺茹 姚涛 +2 位作者 张林梁 孙玉娟 付海燕 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期551-558,共8页
图像中的区域特征更关注于图像中的前景信息,背景信息往往被忽略,如何有效的联合局部特征和全局特征还没有得到充分地研究。为解决上述问题,加强全局概念和局部概念之间的关联得到更准确的视觉特征,提出一种基于多级语义对齐的图像-文... 图像中的区域特征更关注于图像中的前景信息,背景信息往往被忽略,如何有效的联合局部特征和全局特征还没有得到充分地研究。为解决上述问题,加强全局概念和局部概念之间的关联得到更准确的视觉特征,提出一种基于多级语义对齐的图像-文本匹配算法。提取局部图像特征,得到图像中的细粒度信息;提取全局图像特征,将环境信息引入到网络的学习中,从而得到不同的视觉关系层次,为联合的视觉特征提供更多的信息;将全局-局部图像特征进行联合,将联合后的视觉特征和文本特征进行全局-局部对齐得到更加精准的相似度表示。通过大量的实验和分析表明:所提算法在2个公共数据集上具有有效性。 展开更多
关键词 图像-文本匹配 跨模态信息处理 特征提取 神经网络 特征融合
下载PDF
面向医学影像报告生成的门归一化编解码网络
2
作者 谭立玮 张淑军 +2 位作者 韩琪 郭淇 王鸿雁 《智能系统学报》 CSCD 北大核心 2024年第2期411-419,共9页
医学影像报告的自动生成可以减轻医生的工作强度,减少误诊或漏诊的情况发生。由于医学影像的独特性,通常病灶比较小,与正常区域灰度差异难以分辨,导致文本生成时关键词的缺失,报告不够准确。对此提出一种面向医学影像报告生成的门归一... 医学影像报告的自动生成可以减轻医生的工作强度,减少误诊或漏诊的情况发生。由于医学影像的独特性,通常病灶比较小,与正常区域灰度差异难以分辨,导致文本生成时关键词的缺失,报告不够准确。对此提出一种面向医学影像报告生成的门归一化编解码网络,通过门控通道变换单元优化视觉特征提取,加强特征间的差异,自动筛选关键特征;提出门归一化算法,沿通道维度整合上下文信息,在浅层网络激活、深层网络抑制通道间神经元活性,过滤无效特征,使文本和视觉语义充分交互,提高报告生成质量。在2种广泛使用的基准数据集IU X-Ray和MIMIC-CXR上的试验结果表明,模型能够取得先进的性能,生成的影像报告也具有更好的视觉语义一致性。 展开更多
关键词 医学影像处理 文本处理 特征提取 信息融合 通道编码 深度学习 报告生成器 灰度差异
下载PDF
Improved Blending Attention Mechanism in Visual Question Answering
3
作者 Siyu Lu Yueming Ding +4 位作者 Zhengtong Yin Mingzhe Liu Xuan Liu Wenfeng Zheng Lirong Yin 《Computer Systems Science & Engineering》 SCIE EI 2023年第10期1149-1161,共13页
Visual question answering(VQA)has attracted more and more attention in computer vision and natural language processing.Scholars are committed to studying how to better integrate image features and text features to ach... Visual question answering(VQA)has attracted more and more attention in computer vision and natural language processing.Scholars are committed to studying how to better integrate image features and text features to achieve better results in VQA tasks.Analysis of all features may cause information redundancy and heavy computational burden.Attention mechanism is a wise way to solve this problem.However,using single attention mechanism may cause incomplete concern of features.This paper improves the attention mechanism method and proposes a hybrid attention mechanism that combines the spatial attention mechanism method and the channel attention mechanism method.In the case that the attention mechanism will cause the loss of the original features,a small portion of image features were added as compensation.For the attention mechanism of text features,a selfattention mechanism was introduced,and the internal structural features of sentences were strengthened to improve the overall model.The results show that attention mechanism and feature compensation add 6.1%accuracy to multimodal low-rank bilinear pooling network. 展开更多
关键词 Visual question answering spatial attention mechanism channel attention mechanism image feature processing text feature extraction
下载PDF
视频中的文字探测 被引量:13
4
作者 王辰 老松杨 胡晓峰 《小型微型计算机系统》 CSCD 北大核心 2002年第4期478-481,共4页
视频中出现的文字往往包含大量的信息 ,是视频分析的重要语义线索 ,探测并识别出来的文字可以为基于内容的视频检索提供索引 .本文简要介绍了目前现有的一些文字探测的方法 ,结合视频中出现的文字的特点 ,提出了一种较为高效的视频文字... 视频中出现的文字往往包含大量的信息 ,是视频分析的重要语义线索 ,探测并识别出来的文字可以为基于内容的视频检索提供索引 .本文简要介绍了目前现有的一些文字探测的方法 ,结合视频中出现的文字的特点 ,提出了一种较为高效的视频文字探测方法 ,该方法在一般图像质量的条件下对中、英文文字都有较好的探测效果 . 展开更多
关键词 文字探测 视频分析 边缘检测 图像处理 视频检索
下载PDF
图像和视频中的文字获取技术 被引量:13
5
作者 王勇 郑辉 胡德文 《中国图象图形学报(A辑)》 CSCD 北大核心 2004年第5期532-538,共7页
许多图像都包含丰富的文字信息 ,如用作网页设计的以图像形式存在的标语和视频图像中的字幕。这些文字的自动检测、分割、提取和识别 ,对图像高层语义内容的自动理解、索引和检索非常有价值 ,因此引起国内外众多学者的研究兴趣。为使人... 许多图像都包含丰富的文字信息 ,如用作网页设计的以图像形式存在的标语和视频图像中的字幕。这些文字的自动检测、分割、提取和识别 ,对图像高层语义内容的自动理解、索引和检索非常有价值 ,因此引起国内外众多学者的研究兴趣。为使人们对该领域有一个系统的了解 ,并使该领域研究人员有所借鉴 ,在对目前国内外图像和视频中文字获取技术相关文献综合理解的基础上 ,综述了该领域的发展现状 ,同时从文字检测、抽取和文字识别两个方面 ,重点讨论了其主要的技术方法及应用优缺点 ,并结合当前面临的问题 ,指出今后可进一步研究的方向。 展开更多
关键词 图像 视频 文字获取技术 文字信息 文字检测 文字抽取 文字识别
下载PDF
图像和视频分析在电力设备监控系统中的应用 被引量:26
6
作者 杨永辉 刘昌平 黄磊 《计算机应用》 CSCD 北大核心 2010年第A01期281-284,301,共5页
介绍了一种基于图像和视频分析的电力设备智能监控系统。把CCD摄像机拍摄的图像和视频通过网络传输到后端服务器,利用边缘检测、特征提取、目标跟踪和SVM分类器等图像处理和模式识别的方法,自动识别出输电线路的多种安全隐患,如大型机... 介绍了一种基于图像和视频分析的电力设备智能监控系统。把CCD摄像机拍摄的图像和视频通过网络传输到后端服务器,利用边缘检测、特征提取、目标跟踪和SVM分类器等图像处理和模式识别的方法,自动识别出输电线路的多种安全隐患,如大型机械靠近作业、飘挂物、导线覆冰、大风天气产生的导线舞动以及在高负荷状态时出现的弧垂等,并产生预警信号。实验结果表明算法可以在多种室外环境下工作,满足实时高效的要求,具有较好的应用前景。 展开更多
关键词 视频监控 图像处理 模式识别 特征提取SVM分类器
下载PDF
交通流视频检测系统的设计与实现 被引量:7
7
作者 王夏黎 周明全 +1 位作者 耿国华 李华明 《计算机应用与软件》 CSCD 北大核心 2004年第9期68-71,共4页
本文描述了交通流视频检测系统的结构、功能和工作原理。根据系统的功能要求 ,对软件功能模块进行了设计和说明 ,并着重对车流量统计、车速计算和车类识别的算法进行了描述和实现 ;文章最后给出了实现结果并讨论了提高检测系统实时性的... 本文描述了交通流视频检测系统的结构、功能和工作原理。根据系统的功能要求 ,对软件功能模块进行了设计和说明 ,并着重对车流量统计、车速计算和车类识别的算法进行了描述和实现 ;文章最后给出了实现结果并讨论了提高检测系统实时性的具体措施。 展开更多
关键词 交通流视频检测系统 设计 城市交通 道路交通 图像处理 计算机
下载PDF
基于改进单高斯模型法的交通背景提取 被引量:17
8
作者 杨珺 史忠科 《光子学报》 EI CAS CSCD 北大核心 2009年第5期1293-1296,共4页
在分析交通背景提取的特点和单高斯模型法的不足的基础上,提出了一种改进的单高斯模型法.该算法利用均值法初始化背景模型,引入判断值进行背景更新,运用邻域判别法实现干扰点抑制.不同天气条件,不同交通场景下的实验表明:与单高斯模型... 在分析交通背景提取的特点和单高斯模型法的不足的基础上,提出了一种改进的单高斯模型法.该算法利用均值法初始化背景模型,引入判断值进行背景更新,运用邻域判别法实现干扰点抑制.不同天气条件,不同交通场景下的实验表明:与单高斯模型法相比,改进算法在提取背景时可以随车辆的走停及时更新,并且抑制了非静止背景物体的干扰. 展开更多
关键词 计算机图像处理 背景提取 改进单高斯模型法 交通流视频检测
下载PDF
基于多列深度3D卷积神经网络的手势识别 被引量:21
9
作者 易生 梁华刚 茹锋 《计算机工程》 CAS CSCD 北大核心 2017年第8期243-248,共6页
传统2D卷积神经网络对于视频连续帧图像的特征提取容易丢失目标时间轴上的运动信息,导致识别准确度较低。为此,提出一种基于多列深度3D卷积神经网络(3D CNN)的手势识别方法。采用3D卷积核对连续帧图像进行卷积操作,提取目标的时间和空... 传统2D卷积神经网络对于视频连续帧图像的特征提取容易丢失目标时间轴上的运动信息,导致识别准确度较低。为此,提出一种基于多列深度3D卷积神经网络(3D CNN)的手势识别方法。采用3D卷积核对连续帧图像进行卷积操作,提取目标的时间和空间特征捕捉运动信息。为避免因单组3D CNN特征提取不充分而导致的误分类,训练多组具有较强分类能力的3D CNN结构组成多列深度3D CNN,该结构通过对多组3D CNN的输出结果进行权衡,将权重最大的类别判定为最终的输出结果。实验结果表明,将多列深度3D CNN应用于CHGDs数据集上进行手势识别,识别率达到95.09%,与单组3D CNN及传统2D CNN相比分别提高近7%,20%,对连续图像目标识别具有较好的识别能力。 展开更多
关键词 视频图像序列处理 手势识别 深度学习 特征提取 卷积神经网络 运动目标识别
下载PDF
基于优选特征轨迹的全分辨率视频稳定 被引量:3
10
作者 余家林 孙季丰 宋治国 《电子与信息学报》 EI CSCD 北大核心 2015年第5期1141-1148,共8页
该文提出一种基于优选特征轨迹的视频稳定算法。首先,采用改进的Harris角点检测算子提取特征点,通过K-Means聚类算法剔除前景特征点。然后,利用帧间特征点的空间运动一致性减少错误匹配和时间运动相似性实现长时间跟踪,从而获取有效特... 该文提出一种基于优选特征轨迹的视频稳定算法。首先,采用改进的Harris角点检测算子提取特征点,通过K-Means聚类算法剔除前景特征点。然后,利用帧间特征点的空间运动一致性减少错误匹配和时间运动相似性实现长时间跟踪,从而获取有效特征轨迹。最后,建立同时包含特征轨迹平滑度与视频质量退化程度的目标函数计算视频序列的几何变换集以平滑特征轨迹获取稳定视频。针对图像扭曲产生的空白区,由当前帧定义区与参考帧的光流作引导来腐蚀,并通过图像拼接填充仍属于空白区的像素。经仿真验证,该文方法稳定的视频,空白区面积仅为Matsushita方法的33%左右,对动态复杂场景和多个大运动前景均具有较高的有效性并可生成内容完整的视频,既提高了视频的视觉效果,又减轻了费时的边界修复任务。 展开更多
关键词 图像处理 视频稳定 特征点轨迹 图像扭曲 光流 运动修复
下载PDF
DCT域图象处理和特征提取技术 被引量:21
11
作者 刘艳 李宏东 《中国图象图形学报(A辑)》 CSCD 北大核心 2003年第2期121-128,共8页
现今 ,大量的图象与视频信息都是以压缩数据格式进行存储和传输的 .DCT(Discrete Cosine Transform离散余弦变换 )是目前应用最为广泛的多媒体数据压缩技术之一 .直接在 DCT域实现如视频编辑、特征提取等传统空域处理技术 ,能够避免繁... 现今 ,大量的图象与视频信息都是以压缩数据格式进行存储和传输的 .DCT(Discrete Cosine Transform离散余弦变换 )是目前应用最为广泛的多媒体数据压缩技术之一 .直接在 DCT域实现如视频编辑、特征提取等传统空域处理技术 ,能够避免繁琐的压缩数据编、解码操作 ,减少处理时间和数据处理量 ,节省内存空间 .这一技术对于高速海量的数据处理场合 ,如 Internet信息检索、视频编辑和检索、远程监视图象的理解等 ,是很有吸引力的 ,因此其是近年来国际上有关领域的研究热点之一 .本文对近年来文献中所见的 DCT域图象处理和特征提取技术进行了回顾和综述 。 展开更多
关键词 计算机图象处理 DCT 图象编码 压缩域处理 视频编辑 特征提取
下载PDF
基于小波分析的视频图像修复算法 被引量:2
12
作者 丁辉 潘巍 张树东 《电视技术》 北大核心 2011年第11期17-18,46,共3页
图像修复是指恢复图像中破损区域的颜色信息或者去除图像中的多余物体。针对视频图像损坏特征中较复杂的水平与垂直条带,利用视频图像时间连续性的特点,提出基于小波分析理论的修复方法。实验结果表明,该系统能够较好地恢复视频图像和... 图像修复是指恢复图像中破损区域的颜色信息或者去除图像中的多余物体。针对视频图像损坏特征中较复杂的水平与垂直条带,利用视频图像时间连续性的特点,提出基于小波分析理论的修复方法。实验结果表明,该系统能够较好地恢复视频图像和有效去除文字。 展开更多
关键词 视频图像修复 小波变换 视频处理 文字提取
下载PDF
基于多模式分析自动解析新闻视频(英文) 被引量:3
13
作者 王伟强 高文 《软件学报》 EI CSCD 北大核心 2001年第9期1271-1278,共8页
提出一种结合视觉、声音、文字等多种模式信息自动解析新闻视频的方法 ,并对音频特征的提取以及综合多种模式信息解析新闻视频的算法进行了详细的探讨 .多种模式信息的使用有效地弥补了仅基于图像分析技术分割新闻条目的不足 ,从而使该... 提出一种结合视觉、声音、文字等多种模式信息自动解析新闻视频的方法 ,并对音频特征的提取以及综合多种模式信息解析新闻视频的算法进行了详细的探讨 .多种模式信息的使用有效地弥补了仅基于图像分析技术分割新闻条目的不足 ,从而使该方法对不同方式存在的新闻条目在分割时具有更广泛的适应性 .在包含 184 10 0帧的测试数据集上 ,对于新闻条目边界点的检测 ,系统获得了 95 .1%查全率 ,93.3%的正确率 .实验结果证明了该方法的有效性、强壮性 . 展开更多
关键词 MPEG-2 多模式分析 新闻视频 自动解析 图像分析
下载PDF
基于深度学习的目标检测研究综述 被引量:135
14
作者 罗会兰 陈鸿坤 《电子学报》 EI CAS CSCD 北大核心 2020年第6期1230-1239,共10页
目标检测是计算机视觉领域内的热点课题,在机器人导航、智能视频监控及航天航空等领域都有广泛的应用.本文首先综述了目标检测的研究背景、意义及难点,接着对基于深度学习目标检测算法的两大类进行综述,即基于候选区域和基于回归算法.... 目标检测是计算机视觉领域内的热点课题,在机器人导航、智能视频监控及航天航空等领域都有广泛的应用.本文首先综述了目标检测的研究背景、意义及难点,接着对基于深度学习目标检测算法的两大类进行综述,即基于候选区域和基于回归算法.对于第一类算法,先介绍了基于区域的卷积神经网络(Region with Convolutional Neural Network,R-CNN)系列算法,然后从四个维度综述了研究者在R-CNN系列算法基础上所做的研究:对特征提取网络的改进研究、对感兴趣区域池化层的改进研究、对区域提取网络的改进研究、对非极大值抑制算法的改进研究.对第二类算法分为YOLO(You Only Look Once)系列、SSD(Single Shot multibox Detector)算法及其改进研究进行综述.最后根据当前目标检测算法在发展更高效合理的检测框架的趋势下,展望了目标检测算法未来在无监督和未知类别物体检测方向的研究热点. 展开更多
关键词 目标检测 深度学习 特征提取 计算机视觉 视频监控 图像处理 卷积神经网络
下载PDF
航空发动机智能内窥故障诊断 被引量:1
15
作者 官颂 曲培树 +1 位作者 董文会 罗云林 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2009年第6期981-984,共4页
为了解决发动机内窥检测系统提取的图片不清晰的问题,采用理论分析和实验的方法,分析了数字图像处理中直方图均衡化算法和图像特征提取的特点,提出了一种改进的直方图均衡化算法,较好的提取出发动机损伤区域的特征参数(裂纹长度、烧伤... 为了解决发动机内窥检测系统提取的图片不清晰的问题,采用理论分析和实验的方法,分析了数字图像处理中直方图均衡化算法和图像特征提取的特点,提出了一种改进的直方图均衡化算法,较好的提取出发动机损伤区域的特征参数(裂纹长度、烧伤区域面积等)。研究结果表明,该方法实现了发动机故障的定量测量,具有较强的实用价值。 展开更多
关键词 内窥检测 图像处理 形态学处理 参数提取
下载PDF
图文自动分离的方法研究 被引量:2
16
作者 卢朝阳 应道宁 王尔健 《工程图学学报》 CSCD 1994年第2期37-44,共8页
本文给出了一种新的图文自动分离算法,可以将工程图中的文字符号信息与图形信息分割开来。该算法基于对“图”和“文”不同几何特性的分析,采用了不是直接提取文字而是尽量删除非文图形的新思路,对工程图中包含有的中西文、尺寸数字... 本文给出了一种新的图文自动分离算法,可以将工程图中的文字符号信息与图形信息分割开来。该算法基于对“图”和“文”不同几何特性的分析,采用了不是直接提取文字而是尽量删除非文图形的新思路,对工程图中包含有的中西文、尺寸数字及特殊符号等非图文字均能处理,并且对工程图种类、噪声水平、字图粘连及书写方向等因素几乎不加限制。本算法可以应用于工程图自动输入系统、中西文处理与识别及其它CAD/CAM应用中。 展开更多
关键词 CAD CAM 图形处理 模式识别 图文自动分离
下载PDF
基于监控视频的油田施工场景状态识别 被引量:4
17
作者 段鸿杰 计洪图 +1 位作者 李晓宇 梁琦 《自动化技术与应用》 2020年第8期80-85,共6页
场景状态识别作为监控视频内容分析的重要内容,对保障油田监控区域的安全发挥极为重要的作用。本文以胜利油田的监控视频数据为例,对监控视频图像进行图像预处理后,运用灰度梯度共生矩阵和HOG特征提取的方法分类并建模,进而识别监控视... 场景状态识别作为监控视频内容分析的重要内容,对保障油田监控区域的安全发挥极为重要的作用。本文以胜利油田的监控视频数据为例,对监控视频图像进行图像预处理后,运用灰度梯度共生矩阵和HOG特征提取的方法分类并建模,进而识别监控视频状态。经测试,异常场景识别效果良好。 展开更多
关键词 监控视频 图像处理 特征提取 施工场景
下载PDF
通用动态医学影像图文信息系统的设计与实现 被引量:1
18
作者 刘谦 谢越文 陈加宜 《中国数字医学》 2008年第10期24-25,共2页
论述了建设通用动态医学影像图文信息系统的必要性和迫切性,并提出一套基于广域网平台的建设方案,包括网络结构、设计要点、系统总体结构等,作为医院应用的初步探讨。
关键词 图文网络信息系 统动态视频捕获 数字图像处理
下载PDF
双通道视频信息处理数据融合技术 被引量:3
19
作者 李向军 《应用光学》 CAS CSCD 2005年第6期4-7,共4页
“飞鱼”类掠海反舰导弹已对水面大型舰艇的生存构成重大威胁,而近程反导舰炮武器系统是反“飞鱼”类掠海反舰导弹的最后防线。因此,实现成功拦截掠海反舰导弹,精确稳定地自动跟踪目标,是近程反导舰炮武器系统的关键技术之一。阐述了适... “飞鱼”类掠海反舰导弹已对水面大型舰艇的生存构成重大威胁,而近程反导舰炮武器系统是反“飞鱼”类掠海反舰导弹的最后防线。因此,实现成功拦截掠海反舰导弹,精确稳定地自动跟踪目标,是近程反导舰炮武器系统的关键技术之一。阐述了适合自动跟踪高速飞行掠海导弹的双通道视频处理器的构成。对工作原理、去噪预处理、图像分割、特征抽取、识别和位置检测等技术作了简要说明,并对核心部分——双通道视频信息的资源利用和数据融合处理作了较详细的论述。双通道并行处理数据融合技术在国内首次应用于××近程反导舰炮武器系统光电跟踪仪中,在海上定型试验中取得了很好的跟踪效果。 展开更多
关键词 双通道视频信息处理 去噪预处理 图像分割 特征提取 目标识别 数据融合
下载PDF
基于改进Hough变换的手写信函书写线去除方法 被引量:1
20
作者 江兴智 赵宇明 《上海铁道大学学报》 CAS 2000年第6期62-66,共5页
在文本识别预处理中 ,书写线的去除是一重要工作。采用标准Hough变换的主要缺点在于它需要的存储空间量大和计算时间长。提出了改进Hough变换 ,通过空间复用减少了空间要求和重复运算 ,加快了计算速度 ,并结合实际 ,通过限定角度搜索范... 在文本识别预处理中 ,书写线的去除是一重要工作。采用标准Hough变换的主要缺点在于它需要的存储空间量大和计算时间长。提出了改进Hough变换 ,通过空间复用减少了空间要求和重复运算 ,加快了计算速度 ,并结合实际 ,通过限定角度搜索范围和提取特征点 。 展开更多
关键词 图像处理 HOUGH变换 文本处理 书写线去除
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部