期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
Video learning based image classification method for object recognition
1
作者 LEE Hong-ro SHIN Yong-ju 《Journal of Central South University》 SCIE EI CAS 2013年第9期2399-2406,共8页
Automatic image classification is the first step toward semantic understanding of an object in the computer vision area.The key challenge of problem for accurate object recognition is the ability to extract the robust... Automatic image classification is the first step toward semantic understanding of an object in the computer vision area.The key challenge of problem for accurate object recognition is the ability to extract the robust features from various viewpoint images and rapidly calculate similarity between features in the image database or video stream.In order to solve these problems,an effective and rapid image classification method was presented for the object recognition based on the video learning technique.The optical-flow and RANSAC algorithm were used to acquire scene images from each video sequence.After the selection of scene images,the local maximum points on comer of object around local area were found using the Harris comer detection algorithm and the several attributes from local block around each feature point were calculated by using scale invariant feature transform (SIFT) for extracting local descriptor.Finally,the extracted local descriptor was learned to the three-dimensional pyramid match kernel.Experimental results show that our method can extract features in various multi-viewpoint images from query video and calculate a similarity between a query image and images in the database. 展开更多
关键词 image classification multi-viewpoint image feature extraction video learning
下载PDF
Video expression recognition based on frame-level attention mechanism
2
作者 陈瑞 TONG Ying +1 位作者 ZHANG Yiye XU Bo 《High Technology Letters》 EI CAS 2023年第2期130-139,共10页
Facial expression recognition(FER) in video has attracted the increasing interest and many approaches have been made.The crucial problem of classifying a given video sequence into several basic emotions is how to fuse... Facial expression recognition(FER) in video has attracted the increasing interest and many approaches have been made.The crucial problem of classifying a given video sequence into several basic emotions is how to fuse facial features of individual frames.In this paper, a frame-level attention module is integrated into an improved VGG-based frame work and a lightweight facial expression recognition method is proposed.The proposed network takes a sub video cut from an experimental video sequence as its input and generates a fixed-dimension representation.The VGG-based network with an enhanced branch embeds face images into feature vectors.The frame-level attention module learns weights which are used to adaptively aggregate the feature vectors to form a single discriminative video representation.Finally, a regression module outputs the classification results.The experimental results on CK+and AFEW databases show that the recognition rates of the proposed method can achieve the state-of-the-art performance. 展开更多
关键词 facial expression recognition(FER) video sequence attention mechanism feature extraction enhanced feature VGG network image classification neural network
下载PDF
空间位置矫正的稀疏特征图像分类网络
3
作者 姜文涛 陈晨 张晟翀 《光电工程》 CAS CSCD 北大核心 2024年第5期66-82,共17页
为稀疏语义并加强对重点特征的关注,增强空间位置和局部特征的关联性,对特征空间位置进行约束,本文提出空间位置矫正的稀疏特征图像分类网络(SSCNet)。该网络以ResNet-34残差网络为基础,首先,提出稀疏语义强化特征模块(SSEF),SSEF模块... 为稀疏语义并加强对重点特征的关注,增强空间位置和局部特征的关联性,对特征空间位置进行约束,本文提出空间位置矫正的稀疏特征图像分类网络(SSCNet)。该网络以ResNet-34残差网络为基础,首先,提出稀疏语义强化特征模块(SSEF),SSEF模块将深度可分离卷积(DSC)和SE相融合,在稀疏语义的同时增强特征提取能力,并能够保持空间信息的完整性;然后,提出空间位置矫正对称注意力机制(SPCS),SPCS将对称全局坐标注意力机制加到网络特定位置中,能够加强特征之间的空间关系,对特征的空间位置进行约束和矫正,从而增强网路对全局细节特征的感知能力;最后,提出平均池化残差模块(APM),并将APM应用到网络的每个残差分支中,使网络能够更有效地捕捉全局特征信息,增强特征的平移不变性,延缓网络过拟合,提高网络的泛化能力。在多个数据集中,SSCNet相比于其它高性能网络在分类准确率上均有不同程度的提升,证明了其在兼顾全局信息的同时,能够更好地提取局部细节信息,具有较高的分类准确率和较强的泛化性能。 展开更多
关键词 图像分类 特征提取 空间位置矫正 稀疏语义 对称注意力 全局感知
下载PDF
工作面液压支架丢架状态视觉自动检测方法
4
作者 滕贷宇 南柄飞 《工矿自动化》 CSCD 北大核心 2024年第11期99-108,共10页
受采场地质条件变化、泵站压力波动及自动跟机系统误差等因素影响,液压支架在自动跟机移架过程中存在丢架情况,人工丢架监测严重影响工作面自动跟机效率。而基于传感器和感知信息的液压支架实时丢架状态监测方法的稳定性和可靠性较差。... 受采场地质条件变化、泵站压力波动及自动跟机系统误差等因素影响,液压支架在自动跟机移架过程中存在丢架情况,人工丢架监测严重影响工作面自动跟机效率。而基于传感器和感知信息的液压支架实时丢架状态监测方法的稳定性和可靠性较差。针对上述问题,提出一种液压支架丢架状态视觉自动检测方法。首先采用YOLOv8对实时获取的工作面监控视频图像进行工作面目标区域划分,通过充分学习工作面图像内部特征准确获取液压支架底座及推杆的轮廓信息与位置信息,分析不同液压支架底座及推杆的位置信息,确定监控视频图像中的支架号;然后提取相邻液压支架最小底座区域局部图像,利用融合多尺度特征信息的ResNet50卷积网络对底座局部图像进行特征提取,获取图像多尺度融合特征信息,再将特征信息映射到类别空间,获取不同液压支架状态的概率分布,根据概率判断液压支架正常移架或丢架状态,结合支架号信息确定处于丢架状态的液压支架。实验结果表明:基于监控视频的工作面目标区域平均分割精度为0.98,准确实现目标区域结构化提取;支架号自动识别准确率为98.78%,为液压支架丢架状态检测提供准确的支架号信息;工作面液压支架丢架状态视觉自动检测的平均准确率达99.17%,单帧图像处理时间为36 ms,满足采煤工作面AI视频监控系统检测丢架状态的实时性与可靠性需求。 展开更多
关键词 液压支架 丢架视觉检测 视频图像语义分割 支架号识别 多尺度特征信息提取
下载PDF
跨层协同注意和通道分组注意的细粒度图像分类
5
作者 何志祥 齐琦 +1 位作者 何伟 郭龙源 《计算机系统应用》 2024年第3期126-133,共8页
细粒度图像分类的主要挑战在于类间的高度相似性和类内的差异性.现有的研究多数基于深层的特征而忽略了浅层细节信息,然而深层的语义特征由于多次卷积和池化操作往往会丢失大量的细节信息.为了更好地整合浅层和深层的信息,提出了基于跨... 细粒度图像分类的主要挑战在于类间的高度相似性和类内的差异性.现有的研究多数基于深层的特征而忽略了浅层细节信息,然而深层的语义特征由于多次卷积和池化操作往往会丢失大量的细节信息.为了更好地整合浅层和深层的信息,提出了基于跨层协同注意和通道分组注意的细粒度图像分类方法.首先,通过ResNet50加载预训练模型作为骨干网络提取特征,由最后3个阶段提取的特征以3个分支的形式输出,每一个分支的特征通过跨层的方式与其余两个分支的特征计算协同注意并交互融合,其中最后一个阶段的特征经过通道分组注意模块以增强语义特征的学习能力.模型训练可以高效地以端到端的方式在没有边界框和注释的情况下进行训练,实验结果表明,该算法在3个常用细粒度图像数据集CUB-200-2011、Stanford Cars和FGVC-Aircraft上的准确率分别达到了89.5%、94.8%和94.7%. 展开更多
关键词 细粒度图像分类 注意力机制 深度学习 特征提取 语义特征
下载PDF
语义视频检索的现状和研究进展 被引量:14
6
作者 余卫宇 谢胜利 +1 位作者 余英林 潘晓舟 《计算机应用研究》 CSCD 北大核心 2005年第5期1-7,共7页
概述了图像的可视化特征如颜色、纹理、形状和运动信息,时空关系分析,以及多特征目标提取和相似度量度;分析了视频语义的提取,语义查询、检索;探讨了视频语义检索的性能评估,存在的问题和发展方向。
关键词 特征提取 图像检索 时空分析 视频语义物体 视频查询 语义检索
下载PDF
图像和视频分析在电力设备监控系统中的应用 被引量:26
7
作者 杨永辉 刘昌平 黄磊 《计算机应用》 CSCD 北大核心 2010年第A01期281-284,301,共5页
介绍了一种基于图像和视频分析的电力设备智能监控系统。把CCD摄像机拍摄的图像和视频通过网络传输到后端服务器,利用边缘检测、特征提取、目标跟踪和SVM分类器等图像处理和模式识别的方法,自动识别出输电线路的多种安全隐患,如大型机... 介绍了一种基于图像和视频分析的电力设备智能监控系统。把CCD摄像机拍摄的图像和视频通过网络传输到后端服务器,利用边缘检测、特征提取、目标跟踪和SVM分类器等图像处理和模式识别的方法,自动识别出输电线路的多种安全隐患,如大型机械靠近作业、飘挂物、导线覆冰、大风天气产生的导线舞动以及在高负荷状态时出现的弧垂等,并产生预警信号。实验结果表明算法可以在多种室外环境下工作,满足实时高效的要求,具有较好的应用前景。 展开更多
关键词 视频监控 图像处理 模式识别 特征提取SVM分类器
下载PDF
图像场景语义分类研究进展综述 被引量:19
8
作者 顾广华 韩晰瑛 +1 位作者 陈春霞 赵耀 《系统工程与电子技术》 EI CSCD 北大核心 2016年第4期936-948,共13页
场景语义分类是图像理解领域中一个重要的研究方向,涉及到信号处理、模式识别、计算机视觉和认知科学等多学科交叉。场景分类任务中,图像内容描述和分类判决是两大关键问题。图像内容描述力图得到关于场景图像最具判别意义的表示,而分... 场景语义分类是图像理解领域中一个重要的研究方向,涉及到信号处理、模式识别、计算机视觉和认知科学等多学科交叉。场景分类任务中,图像内容描述和分类判决是两大关键问题。图像内容描述力图得到关于场景图像最具判别意义的表示,而分类判决则对训练样本集的图像内容描述学习、训练,并建模得到某类场景图像区别于其他场景类图像的计算模型。目前,很多场景分类方法针对图像内容描述和图像分类进行了深入的研究,对室外人造场景、室外自然场景和室内场景图像进行分类,取得了较好的分类效果。然而,场景图像自身内容上的变化和差异,既会造成同一场景类内对象的差异性,同时也造成不同场景类之间图像的视觉相似性,特别是对于不同的室内场景类。因此,场景语义分类任务十分困难,是计算机视觉和认知心理学领域中一个颇具挑战性的难题。室外图像场景分类研究相对成熟,而室内图像场景分类研究却进展缓慢。本文综述了图像场景语义分类的研究进展,并分析了场景分类算法的性能,指出场景语义分类研究中存在的问题。 展开更多
关键词 场景语义分类 特征提取 图像描述 主题模型 分类器设计
下载PDF
中国画的特征提取及分类 被引量:8
9
作者 陈俊杰 杜雅娟 李海芳 《计算机工程与应用》 CSCD 北大核心 2008年第15期166-169,共4页
中国画作为中国传统文化艺术的瑰宝,根据语义对国画图像进行检索是必要的。国画的语义主要反映在颜色和形状。依据国画自身的特点,研究了颜色和形状的特征提取算法,融合图像的颜色和目标的形状特征,构建了一种新的特征向量,分析了国画... 中国画作为中国传统文化艺术的瑰宝,根据语义对国画图像进行检索是必要的。国画的语义主要反映在颜色和形状。依据国画自身的特点,研究了颜色和形状的特征提取算法,融合图像的颜色和目标的形状特征,构建了一种新的特征向量,分析了国画图像的多维低阶特征与高阶语义之间的相关性,采用支持向量机实现语义分类,实验结果表明该方法提取的特征向量稳定,能得到较高的分类精度。 展开更多
关键词 国画图像 特征提取 支持向量机 语义分类
下载PDF
基于语义关联和信息增益的TFIDF改进算法研究 被引量:8
10
作者 许珂 蒙祖强 林啓峰 《计算机应用研究》 CSCD 北大核心 2012年第2期557-560,共4页
基于词频反文档频率(term frequency inverse document frequency,TFIDF)的现有文本特征提取算法及其改进算法未能考虑类别内部词语之间的语义关联,如果脱离语义,提取出的特征不能很好地刻画文档的内容。为准确提取特征,在信息熵与信息... 基于词频反文档频率(term frequency inverse document frequency,TFIDF)的现有文本特征提取算法及其改进算法未能考虑类别内部词语之间的语义关联,如果脱离语义,提取出的特征不能很好地刻画文档的内容。为准确提取特征,在信息熵与信息增益的基础上,加入词语的语义关联因素,实现融合语义信息的特征提取,进而提出语义和信息增益相结合的TFIDF改进算法,该算法弥补了统计方法丢失语义信息的弊端。实验结果表明,该算法有效地提高了文本分类的精准率。 展开更多
关键词 词频反文档频率 特征提取 语义关联 信息增益 文本分类
下载PDF
深度分类网络研究及其在智能视频监控系统中的应用 被引量:6
11
作者 孙宁 陈梁 +1 位作者 韩光 李晓飞 《电光与控制》 北大核心 2015年第9期77-82,共6页
研究了深度分类网络在道路交通典型目标分类中的应用,使用原始灰度图、HOG特征直方图、Canny边缘图与本征特征等多种目标表征方法与深度置信网络(Deep Belief Networks,DBN)相结合构建深度分类网络实现对行人、骑车人、车辆和其他4种典... 研究了深度分类网络在道路交通典型目标分类中的应用,使用原始灰度图、HOG特征直方图、Canny边缘图与本征特征等多种目标表征方法与深度置信网络(Deep Belief Networks,DBN)相结合构建深度分类网络实现对行人、骑车人、车辆和其他4种典型道路交通目标的分类功能。为了配合基于DBN的深度人车分类网络的训练,建立了称为NUPTERC的典型道路目标图像库,给出了建库的规则和方法,利用NUPTERC图像库构建实验对深度分类网络进行测试,并与其他典型人车分类方法进行了比较。证明深度分类网络在满足实时性的条件下,可以获得令人满意的分类正确率。最后,将基于DBN5Canny的人车分类算法应用于智能视频分析云平台,实现了对道路上的典型目标实时、精确的统计和分类功能。 展开更多
关键词 目标分类 深度置信网络 特征提取 智能视频监控系统
下载PDF
一种基于时空分布特征的新闻字幕检测新算法 被引量:5
12
作者 史迎春 王韬 周献中 《系统仿真学报》 CAS CSCD 2004年第11期2483-2485,2489,共4页
新闻字幕中包含有丰富的语义信息,是实现自动化视频检索、分析和理解的重要信息源之一。本文通过研究新闻字幕的时空分布特征,提出了一个新闻字幕检测新算法,该算法首先用有师学习的方法获取字幕大小、方向、形状等信息;然后根据视频字... 新闻字幕中包含有丰富的语义信息,是实现自动化视频检索、分析和理解的重要信息源之一。本文通过研究新闻字幕的时空分布特征,提出了一个新闻字幕检测新算法,该算法首先用有师学习的方法获取字幕大小、方向、形状等信息;然后根据视频字幕区域的灰度空间差分分布特性,利用字幕的尺寸约束检测字幕,根据字幕时间持续特点,去除时间冗余;最后对字幕区域进行二值化。实验表明该算法对非滚动标注字幕检测效率高,实时性好,且对不同新闻视频具有较强的自适应性。 展开更多
关键词 新闻视频检索 语义提取 字幕检测 时空分布特征 二值化
下载PDF
基于语义信息提取的新闻视频场景分割方法 被引量:5
13
作者 徐骏 李玲青 周洞汝 《计算机工程与应用》 CSCD 北大核心 2003年第4期204-206,221,共4页
随着数字视频的广泛应用,视频数据库系统已成为多媒体领域的一个研究热点。在建立视频数据库的过程中,视频场景的分割是一个重要而又难以解决的问题。文章从分析新闻视频场景所特有的结构特征入手,提出了一种基于语义信息提取的新闻视... 随着数字视频的广泛应用,视频数据库系统已成为多媒体领域的一个研究热点。在建立视频数据库的过程中,视频场景的分割是一个重要而又难以解决的问题。文章从分析新闻视频场景所特有的结构特征入手,提出了一种基于语义信息提取的新闻视频场景分割新方法,该方法通过对音频流和视频流中的镜头变换、主持人镜头、主题字幕和静音区间等语义信息的提取和分析来实现新闻视频场景的分割。实验表明,采用该文提出的方法,场景分割正确率可达86.9%,较好地解决了新闻视频场景分割问题。 展开更多
关键词 视频数据库系统 语义信息提取 新闻视频场景分割方法 场景分割 多媒体
下载PDF
基于支持向量机的图像语义分类(英文) 被引量:34
14
作者 万华林 Morshed U.Chowdhury 《软件学报》 EI CSCD 北大核心 2003年第11期1891-1899,共9页
图像的低层可视特征与高层语义特征之间存在着一道鸿沟,人们不能直接理解由计算机自动生成的低层特征.另外,基于内容的图像分类和检索的性能极大地依赖于可视特征的提取和描述.出于这些考虑,提出了新的图像纹理、边缘描述子提取方法,并... 图像的低层可视特征与高层语义特征之间存在着一道鸿沟,人们不能直接理解由计算机自动生成的低层特征.另外,基于内容的图像分类和检索的性能极大地依赖于可视特征的提取和描述.出于这些考虑,提出了新的图像纹理、边缘描述子提取方法,并将它们表示为直方图.在此基础上,集成纹理、边缘和颜色直方图作为图像的特征向量,用支持向量机(SVM)实现图像的语义分类.实验结果表明,集成的图像特征表示在图像分类实验中取得了很好的效果,具有比其他特征表示(如Gabor纹理、颜色直方图)更好的性能. 展开更多
关键词 基于内容 图像特征描述子 颜色 纹理 边缘 分类 SVM
下载PDF
一种新的基于对象的足球视频镜头分类方案 被引量:3
15
作者 周艺华 曹元大 张龙飞 《计算机工程与应用》 CSCD 北大核心 2005年第34期229-232,共4页
论文提出了一种基于对象的足球视频镜头分类方案。首先对足球视频中的场地和运动员对象进行检测和分割,然后利用识别出的场地特征、运动员数目及运动员与场地比例等特征,对足球视频中的长距镜头、中距镜头、特写及其它类型的镜头进行分... 论文提出了一种基于对象的足球视频镜头分类方案。首先对足球视频中的场地和运动员对象进行检测和分割,然后利用识别出的场地特征、运动员数目及运动员与场地比例等特征,对足球视频中的长距镜头、中距镜头、特写及其它类型的镜头进行分类。实验表明,该分类方案取得了良好的效果。 展开更多
关键词 镜头分类 特征提取 视频摘要
下载PDF
多模态特征融合与多任务学习的特种视频分类 被引量:5
16
作者 吴晓雨 顾超男 王生进 《光学精密工程》 EI CAS CSCD 北大核心 2020年第5期1177-1186,共10页
特种视频(本文特指暴力视频)的智能分类技术有助于实现网络信息内容安全的智能监控。针对现有特种视频多模态特征融合时未考虑语义一致性等问题,本文提出了一种基于音视频多模态特征融合与多任务学习的特种视频识别方法。首先,提取特种... 特种视频(本文特指暴力视频)的智能分类技术有助于实现网络信息内容安全的智能监控。针对现有特种视频多模态特征融合时未考虑语义一致性等问题,本文提出了一种基于音视频多模态特征融合与多任务学习的特种视频识别方法。首先,提取特种视频的表观信息和运动信息随时空变化的视觉语义特征及音频信息语义特征;然后,构建具有语义保持的共享特征子空间,以实现音视频多种模态特征的融合;最后,提出基于音视频特征的语义一致性度量和特种视频分类的多任务学习特种视频分类理论框架,设计了对应的损失函数,实现了端到端的特种视频智能识别。实验结果表明,本文提出的算法在Violent Flow和MediaEval VSD 2015两个数据集上平均精度分别为97.97%和39.76%,优于已有研究。结果证明了该算法的有效性,有助于提升特种视频监控的智能化水平。 展开更多
关键词 特种视频识别 特征提取 多模态特征融合 语义一致性度量 多任务学习
下载PDF
基于GaborSIFT+NNScSPM图像特征抽取算法研究 被引量:2
17
作者 江爱文 王春恒 肖柏华 《自动化学报》 EI CSCD 北大核心 2011年第10期1183-1189,共7页
视觉信息的特征表示是计算机视觉场景图像理解研究中的核心内容.基于GaborSIFT+NNScSPM的图像特征抽取算法,借鉴生物视觉机制中的相关研究成果,有机结合了HMAX层次计算模型的思想和非负稀疏编码的策略,较为合理地模拟了生物视觉皮层中... 视觉信息的特征表示是计算机视觉场景图像理解研究中的核心内容.基于GaborSIFT+NNScSPM的图像特征抽取算法,借鉴生物视觉机制中的相关研究成果,有机结合了HMAX层次计算模型的思想和非负稀疏编码的策略,较为合理地模拟了生物视觉皮层中视觉处理的过程.在15类场景图像和Caltech101两个公开数据集上进行了实验验证,实验结果表明我们所提出的算法较同期算法有着良好的分类性能. 展开更多
关键词 特征抽取 生物视觉机制 HMAX 非负稀疏编码 语义分类
下载PDF
基于视频的火焰检测算法综述 被引量:14
18
作者 曹江涛 秦跃雁 姬晓飞 《数据采集与处理》 CSCD 北大核心 2020年第1期35-52,共18页
近年来,随着计算机视觉技术和数字图像处理技术的不断发展,基于视频分析的火焰检测技术获得越来越多的关注。鉴于基于视频的火焰检测对消防安全、人民生命和国家财产安全等具有重要的实际研究意义,以及其理论基础和影响因素的多样性,本... 近年来,随着计算机视觉技术和数字图像处理技术的不断发展,基于视频分析的火焰检测技术获得越来越多的关注。鉴于基于视频的火焰检测对消防安全、人民生命和国家财产安全等具有重要的实际研究意义,以及其理论基础和影响因素的多样性,本文对目前已有的基于视频的火焰检测算法所涉及的关键技术进行了综述。首先介绍了目前基于视频的火焰检测技术的处理流程,即预处理、特征提取、分类识别;其次着重分析火焰的特征,包括基于单帧的静态特征和基于多帧的动态特征,同时列举了典型的火焰特征提取算法;然后重点总结多特征融合策略和用于火焰识别的常用分类器以及深度学习识别方法;最后对基于视频的火焰检测技术的研究难点和未来发展进行了较为详细的分析探讨。 展开更多
关键词 视频火焰检测 预处理 特征提取 多特征融合 分类识别 深度学习
下载PDF
基于中底层视觉信息的体育视频智能分析 被引量:2
19
作者 屈萍 屈胜国 +1 位作者 康涛 赵云雷 《体育成人教育学刊》 2012年第3期49-51,共3页
在借鉴了计算机视觉技术和多媒体处理算法的基础上,提出了一种基于全自动高效视频分析框架的分析和总结的体育视频分析结构。本视频分析框架拟从底层特征提取、中级关键基元生成出发,初步实现体育视频中的镜头分类和运动对象识别以及跟... 在借鉴了计算机视觉技术和多媒体处理算法的基础上,提出了一种基于全自动高效视频分析框架的分析和总结的体育视频分析结构。本视频分析框架拟从底层特征提取、中级关键基元生成出发,初步实现体育视频中的镜头分类和运动对象识别以及跟踪等。分析框架中包含了一些中低级别的足球视频镜头分类处理算法,如主色区域检测,鲁棒镜头边界检测,以及目标检测等等。 展开更多
关键词 体育视频分析 镜头分类 事件检测 特征提取
下载PDF
面向视觉感知的图像情感识别及其在推荐系统中的应用 被引量:11
20
作者 陈芬 何源 汤丽萍 《情报学报》 CSSCI CSCD 北大核心 2019年第4期420-431,共12页
视觉信息是人们获取外界信息的重要来源。作为视觉信息的主要表现形式之一,图像受到了广泛关注。本文首先针对颜色直方图忽略空间信息的问题,基于图像分块思想,利用图像区域不同、引起的关注程度不同的原理,引入Itti视觉注意模型,进行... 视觉信息是人们获取外界信息的重要来源。作为视觉信息的主要表现形式之一,图像受到了广泛关注。本文首先针对颜色直方图忽略空间信息的问题,基于图像分块思想,利用图像区域不同、引起的关注程度不同的原理,引入Itti视觉注意模型,进行图像显著图的提取,基于显著图计算各分块的加权直方图。其次,根据视觉感知理论,提取多种图像情感信息特征,结合低层的颜色、纹理和形状特征以及高层的面部表情特征,生成复合的图像情感特征描述向量。最后,将本文提出的情感识别模型用于基于情感的电影推荐,结合电影海报及剧情简介文本,进行基于图文结合的电影情感识别,为用户推荐符合其情感需求的电影。本文通过融合基于心理认知的特征及面部表情等诸多特征,实现了更加完善的视觉情感描述,在一定程度上缩小了"语义鸿沟"。 展开更多
关键词 情感分类 特征提取 视觉感知 情感语义 SVM算法
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部