期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
图像场景语义分类研究进展综述 被引量:19
1
作者 顾广华 韩晰瑛 +1 位作者 陈春霞 赵耀 《系统工程与电子技术》 EI CSCD 北大核心 2016年第4期936-948,共13页
场景语义分类是图像理解领域中一个重要的研究方向,涉及到信号处理、模式识别、计算机视觉和认知科学等多学科交叉。场景分类任务中,图像内容描述和分类判决是两大关键问题。图像内容描述力图得到关于场景图像最具判别意义的表示,而分... 场景语义分类是图像理解领域中一个重要的研究方向,涉及到信号处理、模式识别、计算机视觉和认知科学等多学科交叉。场景分类任务中,图像内容描述和分类判决是两大关键问题。图像内容描述力图得到关于场景图像最具判别意义的表示,而分类判决则对训练样本集的图像内容描述学习、训练,并建模得到某类场景图像区别于其他场景类图像的计算模型。目前,很多场景分类方法针对图像内容描述和图像分类进行了深入的研究,对室外人造场景、室外自然场景和室内场景图像进行分类,取得了较好的分类效果。然而,场景图像自身内容上的变化和差异,既会造成同一场景类内对象的差异性,同时也造成不同场景类之间图像的视觉相似性,特别是对于不同的室内场景类。因此,场景语义分类任务十分困难,是计算机视觉和认知心理学领域中一个颇具挑战性的难题。室外图像场景分类研究相对成熟,而室内图像场景分类研究却进展缓慢。本文综述了图像场景语义分类的研究进展,并分析了场景分类算法的性能,指出场景语义分类研究中存在的问题。 展开更多
关键词 场景语义分类 特征提取 图像描述 主题模型 分类器设计
下载PDF
概念间关联依赖多标记视频语义概念分类方法
2
作者 魏维 魏敏 刘凤玉 《中国图象图形学报》 CSCD 北大核心 2010年第6期893-899,共7页
一个镜头中的语义概念通常依赖于其他多个语义概念,几个同时出现的语义概念决定着另一个语义概念的出现。为此提出一种概念间关联依赖多标记视频语义概念分类方法。为得到概念间关联依赖规则,合并和修剪技术用于产生候选的项集;计算各... 一个镜头中的语义概念通常依赖于其他多个语义概念,几个同时出现的语义概念决定着另一个语义概念的出现。为此提出一种概念间关联依赖多标记视频语义概念分类方法。为得到概念间关联依赖规则,合并和修剪技术用于产生候选的项集;计算各候选项集的支持度后,得到满足最小支持度的频繁项集;经过一系列频繁项集迭代,产生具有强关联依赖关系的复合标记;在标记过程中,将具有强关联依赖关系的多个语义标记作为单标记进行标注。实验结果表明,对真实媒体数据本文方法比现有多标记分类方法更能有效进行分类。 展开更多
关键词 视频概念标注 多标记分类 关联规则 语义场景分类
下载PDF
Beyond bag of latent topics: spatial pyramid matching for scene category recognition 被引量:2
3
作者 Fu-xiang LU Jun HUANG 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2015年第10期817-828,共12页
We propose a heterogeneous, mid-level feature based method for recognizing natural scene categories. The proposed feature introduces spatial information among the latent topics by means of spatial pyramid, while the l... We propose a heterogeneous, mid-level feature based method for recognizing natural scene categories. The proposed feature introduces spatial information among the latent topics by means of spatial pyramid, while the latent topics are obtained by using probabilistic latent semantic analysis (pLSA) based on the bag-of-words representation. The proposed feature always performs better than standard pLSA because the performance of pLSA is adversely affected in many cases due to the loss of spatial information. By combining various interest point detectors and local region descriptors used in the bag-of-words model, the proposed feature can make further improvement for diverse scene category recognition tasks. We also propose a two-stage framework for multi-class classification. In the first stage, for each of possible detector/descriptor pairs, adaptive boosting classifiers are employed to select the most discriminative topics and further compute posterior probabilities of an unknown image from those selected topics. The second stage uses the prod-max rule to combine information coming from multiple sources and assigns the unknown image to the scene category with the highest 'final' posterior probability. Experimental results on three benchmark scene datasets show that the proposed method exceeds most state-of-the-art methods. 展开更多
关键词 Scene category recognition Probabilistic latent semantic analysis BAG-OF-WORDS Adaptive boosting
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部