期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
Video learning based image classification method for object recognition
1
作者 LEE Hong-ro SHIN Yong-ju 《Journal of Central South University》 SCIE EI CAS 2013年第9期2399-2406,共8页
Automatic image classification is the first step toward semantic understanding of an object in the computer vision area.The key challenge of problem for accurate object recognition is the ability to extract the robust... Automatic image classification is the first step toward semantic understanding of an object in the computer vision area.The key challenge of problem for accurate object recognition is the ability to extract the robust features from various viewpoint images and rapidly calculate similarity between features in the image database or video stream.In order to solve these problems,an effective and rapid image classification method was presented for the object recognition based on the video learning technique.The optical-flow and RANSAC algorithm were used to acquire scene images from each video sequence.After the selection of scene images,the local maximum points on comer of object around local area were found using the Harris comer detection algorithm and the several attributes from local block around each feature point were calculated by using scale invariant feature transform (SIFT) for extracting local descriptor.Finally,the extracted local descriptor was learned to the three-dimensional pyramid match kernel.Experimental results show that our method can extract features in various multi-viewpoint images from query video and calculate a similarity between a query image and images in the database. 展开更多
关键词 image classification multi-viewpoint image feature extraction video learning
下载PDF
Video expression recognition based on frame-level attention mechanism
2
作者 陈瑞 TONG Ying +1 位作者 ZHANG Yiye XU Bo 《High Technology Letters》 EI CAS 2023年第2期130-139,共10页
Facial expression recognition(FER) in video has attracted the increasing interest and many approaches have been made.The crucial problem of classifying a given video sequence into several basic emotions is how to fuse... Facial expression recognition(FER) in video has attracted the increasing interest and many approaches have been made.The crucial problem of classifying a given video sequence into several basic emotions is how to fuse facial features of individual frames.In this paper, a frame-level attention module is integrated into an improved VGG-based frame work and a lightweight facial expression recognition method is proposed.The proposed network takes a sub video cut from an experimental video sequence as its input and generates a fixed-dimension representation.The VGG-based network with an enhanced branch embeds face images into feature vectors.The frame-level attention module learns weights which are used to adaptively aggregate the feature vectors to form a single discriminative video representation.Finally, a regression module outputs the classification results.The experimental results on CK+and AFEW databases show that the recognition rates of the proposed method can achieve the state-of-the-art performance. 展开更多
关键词 facial expression recognition(FER) video sequence attention mechanism feature extraction enhanced feature VGG network image classification neural network
下载PDF
基于空频域特征提取的小样本图像分类算法
3
作者 赵洋 任劼 《自动化应用》 2024年第7期13-16,共4页
小样本学习的目的是使用极少的样本训练模型,并在有限的数据集上构建一种有效的模型,以实现对新样本的准确预测。关于小样本图像分类的研究大多只从空域的角度去提取图像的特征进行学习,且在计算相似性分数时采用单一的度量模式,极大地... 小样本学习的目的是使用极少的样本训练模型,并在有限的数据集上构建一种有效的模型,以实现对新样本的准确预测。关于小样本图像分类的研究大多只从空域的角度去提取图像的特征进行学习,且在计算相似性分数时采用单一的度量模式,极大地降低了图像分类的准确性。为此,提出了一种基于空频域特征提取的小样本图像分类算法网络(FENet),从空域和频域角度出发,提取图像特征,并结合图像到图像的度量与图像到类的度量方式,引入干扰因子,提高模型的鲁棒性和泛化性。在CUB-200-2011、Stanford-Cars、Stanford-Dogs 3个数据集上进行了大量的实验,结果表明,FENet在一定程度上能提升小样本图像分类的准确性。 展开更多
关键词 小样本学习 空频域特征提取 图像分类
下载PDF
基于多特征融合的小样本视频行为识别算法 被引量:5
4
作者 蒲瞻星 葛永新 《计算机学报》 EI CAS CSCD 北大核心 2023年第3期594-608,共15页
现有基于小样本学习的视频行为识别方法,在解决小样本学习中信息量稀缺问题时存在信息重复度高以及类间相似性大等不足,而且鲜有关注小样本学习中的域偏移与枢纽点问题,从而导致动作类表达能力弱和行为识别中错误分类的问题,此外,复杂... 现有基于小样本学习的视频行为识别方法,在解决小样本学习中信息量稀缺问题时存在信息重复度高以及类间相似性大等不足,而且鲜有关注小样本学习中的域偏移与枢纽点问题,从而导致动作类表达能力弱和行为识别中错误分类的问题,此外,复杂的网络结构导致参数量与计算量成倍增加.针对以上问题,本文提出一种基于多特征融合的小样本视频行为识别算法,具体来说,该方法提出深度特征与流形特征的融合策略.首先,针对特征形式之一的流形特征,提出使用表征传播对流形结构进行平滑操作,更好地缓解了小样本学习中的域偏移与枢纽点问题.其次,通过同时使用对视频特征表达能力不同的深度特征与流形特征,获得更多的样本有效信息,进而缓解小样本学习中样本稀缺的问题.最后,为减小模型的参数量与计算量,选择基于2D方法构建模型.在HMDB51、UCF101以及Kinetics三个数据集上进行实验,结果表明,本文方法在“5-way 1-shot”任务下表现突出,识别率优于现有的小样本视频行为识别方法,在HMDB51上提高了8.5%,在UCF101上提高了9.5%,在Kinetics上提高了1.0%. 展开更多
关键词 小样本学习 行为识别 视频分类 数据的流形分布 多特征融合
下载PDF
基于图卷积神经网络和RoBERTa的物流订单分类 被引量:1
5
作者 王建兵 杨超 +2 位作者 刘方方 黄暕 项勇 《计算机技术与发展》 2023年第10期195-201,共7页
订单信息贯穿于物流供应链的所有环节,高效的订单处理是保障物流服务质量和运营效率的关键。面对日益增长的差异化客户物流订单,人工对订单分类费时、低效,难以满足现代物流要求的效率标准。为了提升物流订单分类的性能,该文提出了一种... 订单信息贯穿于物流供应链的所有环节,高效的订单处理是保障物流服务质量和运营效率的关键。面对日益增长的差异化客户物流订单,人工对订单分类费时、低效,难以满足现代物流要求的效率标准。为了提升物流订单分类的性能,该文提出了一种基于图卷积神经网络(graph convolution network,GCN)和RoBERTa预训练语言模型的订单分类方法。首先,基于物流订单文本的抽象语义表示(abstract meaning representation,AMR)结果和关键词构建全局AMR图,并使用图卷积神经网络对全局AMR图进行特征提取,获取订单文本的全局AMR图表示向量;其次,基于AMR算法构建物流订单文本分句的局部AMR图集合,然后使用堆叠GCN处理图集合得到订单文本局部AMR图表示向量;再次,使用RoBERTa模型处理物流订单文本,得到文本语义表示向量;最后,融合三种类型的文本表示向量完成物流订单分类。实验结果表明:该方法在多项评价指标上优于其他基线方法。消融实验结果也验证了该分类方法各模块的有效性。 展开更多
关键词 订单分类 图卷积神经网络 抽象语义表示 RoBERTa模型 特征提取
下载PDF
基于多重并联图神经网络的小样本图像分类算法
6
作者 吴婕 张海翔 《计算机时代》 2023年第12期40-43,共4页
小样本学习(few-shot learning,FSL)中,由于样本量过少,导致了特征多样性的降低。为了弥补特征多样性的降低,提出通过提高模型的特征提取能力,以获得更为充分的特征数量。利用多重并联图神经网络来进行多重特征提取,使模型更充分地提取... 小样本学习(few-shot learning,FSL)中,由于样本量过少,导致了特征多样性的降低。为了弥补特征多样性的降低,提出通过提高模型的特征提取能力,以获得更为充分的特征数量。利用多重并联图神经网络来进行多重特征提取,使模型更充分地提取图像特征,从而提升小样本图像分类任务的分类准确率。所提出的多重特征提取方法在5-way1-shot设置下将基线的分类准确率提高了2.02%,在5-way 5-shot设置下将基线的分类准确率提高了1.98%。 展开更多
关键词 小样本学习 小样本图像分类 多重特征提取 图神经网络
下载PDF
面向石化厂区安全风险防控的异常场景图像识别技术研究 被引量:1
7
作者 刘瑾萱 《安全、健康和环境》 2023年第5期16-21,共6页
针对石化厂区安全风险防控的需求,提出了一种基于卷积神经网络的单分类图像识别算法。为了构建识别模型,首先创建了一个带标签的厂区火灾、烟雾图像数据集用于模型的训练。其次,通过特征提取及分类器模块,实现了对视频监控异常场景的识... 针对石化厂区安全风险防控的需求,提出了一种基于卷积神经网络的单分类图像识别算法。为了构建识别模型,首先创建了一个带标签的厂区火灾、烟雾图像数据集用于模型的训练。其次,通过特征提取及分类器模块,实现了对视频监控异常场景的识别。此外,设计了一种全新的损失函数,以增强异常场景识别能力。该算法采用端到端的网络架构,解决了传统目标检测方法的结构臃肿、计算复杂等问题,减少了模型的复杂程度,弥补了现有视频监控资源利用场景的不足,进一步提高了厂区风险识别能力。实验结果表明,所提出的单分类视频监控图像识别算法在准确率等方面优于现有算法。 展开更多
关键词 损失函数 深度学习 特征提取 单分类算法 危险场景识别 视频监控识别
下载PDF
利用改进NFL算法对镜头进行基于内容的检索 被引量:12
8
作者 赵黎 杨士强 +2 位作者 祁卫 李子青 张宏江 《软件学报》 EI CSCD 北大核心 2002年第4期586-590,共5页
基于镜头的分类和检索对于视频库的管理和查询非常重要.将“最近特征线”法(nearest feature line,简称NFL)用于镜头的分类和检索.将镜头中的代表帧看做是某个特征空间中的点,通过这些点间的连线表征该镜头的总体特征信息,然后计算查... 基于镜头的分类和检索对于视频库的管理和查询非常重要.将“最近特征线”法(nearest feature line,简称NFL)用于镜头的分类和检索.将镜头中的代表帧看做是某个特征空间中的点,通过这些点间的连线表征该镜头的总体特征信息,然后计算查询图像和特征线的距离,以决定镜头与查询图像的相似度.为了更适于视频数据,对原来的NFL方法进行了改进,基于镜头内部内容活动程度对特征线进行限制、实验结果表明,改进的NFL方法比传统的NFL方法以及常用的聚类万法,如最近邻法(nearest neighbor,简称NN)和最近中心法(nearest center,简称NC),在性能上有所提高. 展开更多
关键词 内容检索 最近特征线 视频检索 视频分类 视频镜头 NFL算法 视频数据库
下载PDF
图像和视频分析在电力设备监控系统中的应用 被引量:26
9
作者 杨永辉 刘昌平 黄磊 《计算机应用》 CSCD 北大核心 2010年第A01期281-284,301,共5页
介绍了一种基于图像和视频分析的电力设备智能监控系统。把CCD摄像机拍摄的图像和视频通过网络传输到后端服务器,利用边缘检测、特征提取、目标跟踪和SVM分类器等图像处理和模式识别的方法,自动识别出输电线路的多种安全隐患,如大型机... 介绍了一种基于图像和视频分析的电力设备智能监控系统。把CCD摄像机拍摄的图像和视频通过网络传输到后端服务器,利用边缘检测、特征提取、目标跟踪和SVM分类器等图像处理和模式识别的方法,自动识别出输电线路的多种安全隐患,如大型机械靠近作业、飘挂物、导线覆冰、大风天气产生的导线舞动以及在高负荷状态时出现的弧垂等,并产生预警信号。实验结果表明算法可以在多种室外环境下工作,满足实时高效的要求,具有较好的应用前景。 展开更多
关键词 视频监控 图像处理 模式识别 特征提取SVM分类器
下载PDF
一种新的基于对象的足球视频镜头分类方案 被引量:3
10
作者 周艺华 曹元大 张龙飞 《计算机工程与应用》 CSCD 北大核心 2005年第34期229-232,共4页
论文提出了一种基于对象的足球视频镜头分类方案。首先对足球视频中的场地和运动员对象进行检测和分割,然后利用识别出的场地特征、运动员数目及运动员与场地比例等特征,对足球视频中的长距镜头、中距镜头、特写及其它类型的镜头进行分... 论文提出了一种基于对象的足球视频镜头分类方案。首先对足球视频中的场地和运动员对象进行检测和分割,然后利用识别出的场地特征、运动员数目及运动员与场地比例等特征,对足球视频中的长距镜头、中距镜头、特写及其它类型的镜头进行分类。实验表明,该分类方案取得了良好的效果。 展开更多
关键词 镜头分类 特征提取 视频摘要
下载PDF
一种基于SVD的镜头边界检测方法 被引量:3
11
作者 胡双演 李俊山 +2 位作者 李建军 王蕊 杨威 《计算机应用》 CSCD 北大核心 2007年第1期155-156,159,共3页
为了有效地进行视频镜头边界检测,在简要介绍了现有的镜头边界检测基本方法的基础上提出了基于SVD的镜头边界检测方法。该方法通过特征提取来构造视频特征矩阵,经过SVD变换得到特征值矩阵,然后将特征值矩阵映射到向量空间,最后通过分析... 为了有效地进行视频镜头边界检测,在简要介绍了现有的镜头边界检测基本方法的基础上提出了基于SVD的镜头边界检测方法。该方法通过特征提取来构造视频特征矩阵,经过SVD变换得到特征值矩阵,然后将特征值矩阵映射到向量空间,最后通过分析向量间的夹角来判断镜头的变化。实验结果表明,在镜头边界检测性能上优于已有的基于帧差的双阈值镜头边界检测方法。 展开更多
关键词 镜头边界检测 奇异值分解 视频特征提取 视频特征矩阵
下载PDF
基于数据挖掘的视频镜头分类方法 被引量:3
12
作者 赵士伟 卓力 +1 位作者 孙少卿 沈兰荪 《北京工业大学学报》 EI CAS CSCD 北大核心 2012年第5期721-726,共6页
提出了一种基于数据挖掘的视频镜头风格自动分类方法.该方法首先进行镜头边界检测和关键帧提取,然后基于关键帧和镜头分别提取了视频的颜色和运动等特征,并利用决策树技术在大量的训练数据中挖掘这些特征与镜头类别之间的潜在规律,最后... 提出了一种基于数据挖掘的视频镜头风格自动分类方法.该方法首先进行镜头边界检测和关键帧提取,然后基于关键帧和镜头分别提取了视频的颜色和运动等特征,并利用决策树技术在大量的训练数据中挖掘这些特征与镜头类别之间的潜在规律,最后利用这些规律对新的视频镜头进行分类.实验结果表明,与基于SVM的方法相比,本文方法不仅能获得较好的检测准确率,而且获取的规则易于理解. 展开更多
关键词 视频镜头分类 镜头边界检测 关键帧提取 数据挖掘
下载PDF
图象和视频的检索技术 被引量:8
13
作者 樊凌涛 陈健 《计算机工程与应用》 CSCD 北大核心 2001年第9期71-77,共7页
随着网络技术的发展,多媒体数据将成为网络服务的主要内容,因此对多媒体数据管理问题的研究成为近几年的热点。由于媒体信息表现性质的不同,传统关系数据库的检索方式不再适用于图象和视频,因此,必须采用基于自身内容的检索方式。... 随着网络技术的发展,多媒体数据将成为网络服务的主要内容,因此对多媒体数据管理问题的研究成为近几年的热点。由于媒体信息表现性质的不同,传统关系数据库的检索方式不再适用于图象和视频,因此,必须采用基于自身内容的检索方式。文章对基于内容的图象和视频检索技术分不同层次进行了全面的总结,内容包括依据基本特征,色彩、纹理、形状、和位置关系的技术,视频的场景分割、关键帧提取技术以及基于声音、文字的检索技术等,并阐述了各种方法的优缺点,现状及发展方向。 展开更多
关键词 多媒体数据库 视频分割 关键帧提取 图象检索 视频检索
下载PDF
深度分类网络研究及其在智能视频监控系统中的应用 被引量:6
14
作者 孙宁 陈梁 +1 位作者 韩光 李晓飞 《电光与控制》 北大核心 2015年第9期77-82,共6页
研究了深度分类网络在道路交通典型目标分类中的应用,使用原始灰度图、HOG特征直方图、Canny边缘图与本征特征等多种目标表征方法与深度置信网络(Deep Belief Networks,DBN)相结合构建深度分类网络实现对行人、骑车人、车辆和其他4种典... 研究了深度分类网络在道路交通典型目标分类中的应用,使用原始灰度图、HOG特征直方图、Canny边缘图与本征特征等多种目标表征方法与深度置信网络(Deep Belief Networks,DBN)相结合构建深度分类网络实现对行人、骑车人、车辆和其他4种典型道路交通目标的分类功能。为了配合基于DBN的深度人车分类网络的训练,建立了称为NUPTERC的典型道路目标图像库,给出了建库的规则和方法,利用NUPTERC图像库构建实验对深度分类网络进行测试,并与其他典型人车分类方法进行了比较。证明深度分类网络在满足实时性的条件下,可以获得令人满意的分类正确率。最后,将基于DBN5Canny的人车分类算法应用于智能视频分析云平台,实现了对道路上的典型目标实时、精确的统计和分类功能。 展开更多
关键词 目标分类 深度置信网络 特征提取 智能视频监控系统
下载PDF
基于中底层视觉信息的体育视频智能分析 被引量:2
15
作者 屈萍 屈胜国 +1 位作者 康涛 赵云雷 《体育成人教育学刊》 2012年第3期49-51,共3页
在借鉴了计算机视觉技术和多媒体处理算法的基础上,提出了一种基于全自动高效视频分析框架的分析和总结的体育视频分析结构。本视频分析框架拟从底层特征提取、中级关键基元生成出发,初步实现体育视频中的镜头分类和运动对象识别以及跟... 在借鉴了计算机视觉技术和多媒体处理算法的基础上,提出了一种基于全自动高效视频分析框架的分析和总结的体育视频分析结构。本视频分析框架拟从底层特征提取、中级关键基元生成出发,初步实现体育视频中的镜头分类和运动对象识别以及跟踪等。分析框架中包含了一些中低级别的足球视频镜头分类处理算法,如主色区域检测,鲁棒镜头边界检测,以及目标检测等等。 展开更多
关键词 体育视频分析 镜头分类 事件检测 特征提取
下载PDF
一种基于粗糙集的视频分类方法 被引量:3
16
作者 李睿 王彤 李明 《微计算机信息》 北大核心 2006年第08X期49-51,54,共4页
视频流的数据量大,又是一种非结构性的数据,因此视频分类一直是视频分析工作中的一个难点。提出了首先进行视频分割,形成了一个视频属性数据库;然后使用粗糙集的属性约简方法对视频属性数据库进行数据挖掘,提取出分类规则集,实现对视频... 视频流的数据量大,又是一种非结构性的数据,因此视频分类一直是视频分析工作中的一个难点。提出了首先进行视频分割,形成了一个视频属性数据库;然后使用粗糙集的属性约简方法对视频属性数据库进行数据挖掘,提取出分类规则集,实现对视频数据库的分类。 展开更多
关键词 视频分类 粗糙集 特征提取 分类规则
下载PDF
基于视频的火焰检测算法综述 被引量:14
17
作者 曹江涛 秦跃雁 姬晓飞 《数据采集与处理》 CSCD 北大核心 2020年第1期35-52,共18页
近年来,随着计算机视觉技术和数字图像处理技术的不断发展,基于视频分析的火焰检测技术获得越来越多的关注。鉴于基于视频的火焰检测对消防安全、人民生命和国家财产安全等具有重要的实际研究意义,以及其理论基础和影响因素的多样性,本... 近年来,随着计算机视觉技术和数字图像处理技术的不断发展,基于视频分析的火焰检测技术获得越来越多的关注。鉴于基于视频的火焰检测对消防安全、人民生命和国家财产安全等具有重要的实际研究意义,以及其理论基础和影响因素的多样性,本文对目前已有的基于视频的火焰检测算法所涉及的关键技术进行了综述。首先介绍了目前基于视频的火焰检测技术的处理流程,即预处理、特征提取、分类识别;其次着重分析火焰的特征,包括基于单帧的静态特征和基于多帧的动态特征,同时列举了典型的火焰特征提取算法;然后重点总结多特征融合策略和用于火焰识别的常用分类器以及深度学习识别方法;最后对基于视频的火焰检测技术的研究难点和未来发展进行了较为详细的分析探讨。 展开更多
关键词 视频火焰检测 预处理 特征提取 多特征融合 分类识别 深度学习
下载PDF
基于神经网络的运动视频图像分类和识别研究 被引量:4
18
作者 刘伟博 白鲲 《现代电子技术》 2021年第20期163-167,共5页
当前运动视频的图像分类和识别方法存在图像识别率低、识别不清晰图像较难的问题,为解决上述问题,文中提出基于神经网络的运动视频图像分类和识别研究。采用目标轮廓周长平方比轮廓面积的方法,提取运动目标图像特征,通过提取图像特征结... 当前运动视频的图像分类和识别方法存在图像识别率低、识别不清晰图像较难的问题,为解决上述问题,文中提出基于神经网络的运动视频图像分类和识别研究。采用目标轮廓周长平方比轮廓面积的方法,提取运动目标图像特征,通过提取图像特征结果设计图像分类流程,建立神经网络图像分类模型完成图像识别。针对同一元素的不同角度进行拍摄获取,采用误差反向传播算法完成神经网络下的运动视频图像分类和识别。通过仿真实验验证设计方法的性能,实验结果表明,所提方法对运动视频图像的识别率较高,正确率在98%以上,且图像识别分类较全面。所提方法能够对运动视频图像中的元素进行分类,识别不清晰图像,提高了识别的精准度,为实际应用提供了一定的参考。 展开更多
关键词 运动视频 图像分类 图像识别 神经网络 图像特征提取 图像分类模型 实验论证
下载PDF
蚁群优化算法优化支持向量机的视频分类 被引量:1
19
作者 王杨 刘蒙 闫伟光 《现代电子技术》 北大核心 2020年第1期56-58,62,共4页
针对当前支持向量机支持优化的参数无法获得高精度的体育视频分类结果的难题,为了提高体育视频分类正确率,提出基于蚁群优化算法优化支持向量机的体育视频分类方法。首先采集体育视频,并提取体育视频分类的多个特征;然后采用主成分分析... 针对当前支持向量机支持优化的参数无法获得高精度的体育视频分类结果的难题,为了提高体育视频分类正确率,提出基于蚁群优化算法优化支持向量机的体育视频分类方法。首先采集体育视频,并提取体育视频分类的多个特征;然后采用主成分分析算法对体育视频分类特征进行处理,作为支持向量机的输入,体育视频类别作为支持向量机的输出,建立体育视频分类模型,并采用蚁群优化算法对支持向量机进行优化;最后采用多个体育视频数据进行分类仿真实验,结果表明,蚁群优化算法优化支持向量机的体育视频分类正确率高于90%,降低了体育视频分类错误,体育视频分类效果明显优于当前其他类型的体育视频分类方法,而且体育视频分类效率得到有效的改善。 展开更多
关键词 体育视频 分类方法 蚁群优化算法 主成分分析 特征提取 支持向量机优化
下载PDF
基于多模态音视频融合的质量评价算法 被引量:2
20
作者 袁同庆 席鹏 《沈阳工业大学学报》 CAS 北大核心 2022年第3期331-335,共5页
针对传统客观评价方法中仅采用调查问卷的数据进质量评价和分类,存在数据不足和相对片面的问题,提出了一种基于多模态音视频融合的客观质量评价算法.该算法充分考虑了客观质量评价过程中产生的视频、语音和文本数据,并分别提取了各类数... 针对传统客观评价方法中仅采用调查问卷的数据进质量评价和分类,存在数据不足和相对片面的问题,提出了一种基于多模态音视频融合的客观质量评价算法.该算法充分考虑了客观质量评价过程中产生的视频、语音和文本数据,并分别提取了各类数据中与评价结果相关的特征,通过对多模态数据特征进行加权融合和分类后,得到客观评价结果.以教学质量评价为例,采用自行搜集整理的客观评价数据构建的质量评价数据集进行评估分析.结果表明,与现有方法和基于调查问卷的传统方法相比,所提方法能够明显提升客观质量评价的精度. 展开更多
关键词 客观评价 质量评价 多模态特征 语音 视频 文本分类 特征提取
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部