-
题名基于百度百科与文本分类的网络文本语义主题抽取方法
被引量:9
- 1
-
-
作者
陈叶旺
王华珍
李海波
钟必能
陈锻生
-
机构
华侨大学计算机科学学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第12期2605-2610,共6页
-
基金
福建省自然科学基金项目(2012J05117
2012J1272)资助
+2 种基金
中央高校基本科研业务费(JB-ZR1217)资助
华侨大学科研启动基金项目(09BS515
11BS109)资助
-
文摘
网络上存在海量中文文本资源,其中许多具有稀疏性与不规范性,难于处理与挖掘.百度百科是一个丰富的与社会热点、网络流行紧密相关的动态中文知识库,基于百度百科本文提出一种网络文本语义主题抽取方法.首先利用百度百科的知识关系将文本映射到侯选语义主题空间中,根据训练数据进行分类,找出最大可能的分类,选出属于该分类的候选语义主题.最后提出根据语义离散度确定最终语义主题.在两个数据集上的实验结果表明,该方法不仅对网络不规范文本而且对于规则文本都具有较好的语义主题抽取性能.
-
关键词
百度百科
语义主题
主题抽取
语义离散度
-
Keywords
BaiduBaike
semantic topic
topic extraction
semantic discrete degree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于潜语义主题加强的跨媒体检索算法
被引量:11
- 2
-
-
作者
黄育
张鸿
-
机构
武汉科技大学计算机科学与技术学院
智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学)
-
出处
《计算机应用》
CSCD
北大核心
2017年第4期1061-1064,1110,共5页
-
基金
国家自然科学基金资助项目(61003127
61373109)~~
-
文摘
针对不同模态数据对相同语义主题表达存在差异性,以及传统跨媒体检索算法忽略了不同模态数据能以合作的方式探索数据的内在语义信息等问题,提出了一种新的基于潜语义主题加强的跨媒体检索(LSTR)算法。首先,利用隐狄利克雷分布(LDA)模型构造文本语义空间,然后以词袋(Bo W)模型来表达文本对应的图像;其次,使用多分类逻辑回归对图像和文本分类,用得到的基于多分类的后验概率表示文本和图像的潜语义主题;最后,利用文本潜语义主题去正则化图像的潜语义主题,使图像的潜语义主题得到加强,同时使它们之间的语义关联最大化。在Wikipedia数据集上,文本检索图像和图像检索文本的平均查准率为57.0%,比典型相关性分析(CCA)、SM(Semantic Matching)、SCM(Semantic Correlation Matching)算法的平均查准率分别提高了35.1%、34.8%、32.1%。实验结果表明LSTR算法能有效地提高跨媒体检索的平均查准率。
-
关键词
跨媒体检索
潜语义主题
多分类逻辑回归
后验概率
正则化
-
Keywords
cross-media retrieval
latent semantic topic
multiclass logistic regression
posterior probability
regularization
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于视觉语义主题的图像自动标注
被引量:3
- 3
-
-
作者
孙君顶
李海华
靳姣林
-
机构
河南理工大学计算机科学与技术学院
-
出处
《测控技术》
CSCD
2016年第12期11-15,共5页
-
基金
河南省基础与前沿技术研究项目(132300410462
112300410281)
-
文摘
为减小图像检索中语义鸿沟的影响,提出了一种基于视觉语义主题的图像自动标注方法。首先,提取图像前景与背景区域,并分别进行预处理;然后,基于概率潜在语义分析与高斯混合模型建立图像底层特征、视觉语义主题与标注关键词间的联系,并基于该模型实现对图像的自动标注。采用corel 5数据库进行验证,实验结果证明了本文方法的有效性。
-
关键词
视觉语义主题
概率潜在语义分析
高斯混合模型
图像自动标注
-
Keywords
visual semantic topics
probabilistic latent semantic analysis
Gaussian mixture model
automaticimage annotation
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义主题相似度的Web教育资源查询方法
被引量:1
- 4
-
-
作者
王杨
尤科本
吴梦婷
虞威
陈付龙
赵传信
-
机构
安徽师范大学数学与计算机科学学院
-
出处
《计算机技术与发展》
2014年第2期104-106,110,共4页
-
基金
中国博士后基金项目(20100480701)
教育部人文社科青年基金项目(11YJC880119)
-
文摘
针对传统Web教育主体难以获得高可用教育资源的问题,提出了一种面向语义主题相似度的Web教育资源查询方法。该方法建立了本体概念语义网络(Ontology Concept Semantic Network,OCSN),在此基础上,设计了基于语义主题相似度匹配的概念检索方法:在检索前主动将教育资源根据其语义和主题组织到本体概念语义网络中,然后建立一个基于语义特性的Web教育资源发现的垂直搜索引擎,并通过构造满足条件的相似度函数,将对应的语义距离映射为相似度,有效地提高了查询效率。实验结果表明此方法能够提高Web教育资源的查准率和查全率。
-
关键词
语义主题
本体知识库
资源组织框架
相似度匹配
-
Keywords
semantic theme
ontology knowledge base
resources organizational framework
similarity matching
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于“语义主题模型”的知识系统框架设计及应用研究
- 5
-
-
作者
李颖
张毅
-
机构
中国科学技术信息研究所
北京外国语大学
-
出处
《数字图书馆论坛》
2012年第4期24-27,共4页
-
基金
“十二五科技支撑计划--科技知识组织体系共享服务平台建设”资金支持(编号:2011BAH10B03-2)
中国科学技术信息研究所“汉语科技词系统建设与应用工程”重点工作和国家抖技支撑计划“面向外文科技文献信息的超级科技词表和本体建设”子任务支持.
-
文摘
构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求,提出了“语义主题模型”,目标为构建可实施的语义化知识系统。文章首先对以“概念化主题、主题关联、语义标签”为内涵的“语义主题化模型”概念进行定义;其次,设计基于此模型的语义化知识系统框架;再次,对相关应用进行了探讨;最后,对未来开发工作进行了规划。
-
关键词
语义主题模型
知识系统框架
主题
-
Keywords
Semantic topicized model, Knowledge system framework, Topic, Subject
-
分类号
G250.76
[文化科学—图书馆学]
-
-
题名基于支持向量机的线条图像语义主题自动发现方法
- 6
-
-
作者
金聪
刘金安
-
机构
华中师范大学计算机学院
-
出处
《图像与信号处理》
2014年第3期78-85,共8页
-
基金
教育部人文社会科学规划基金项目(11YJAZH040)的研究成果之一。
-
文摘
提出了一种基于支持向量机分类器的线条图像语义主题自动发现方法。首先对训练图像进行分块,在对图像子块进行聚类后,得到由聚类中心构成的类集合;从每幅训练图像的注释文字中提取所有名词构成关键词集合。其次,对未标注的测试图像进行同样分块处理,计算子块与每个关键词的相关性,得到每个子块的标注词集合。最后,计算每个关键词在各个子块标注中出现的次数,取出现次数最多的关键词作为图像的语义主题。实验结果表明,所提出的方法对于线条图像的语义主题自动发现是有效的,具有比较好的性能。
-
关键词
数字图像
语义主题发现
图像块聚类
支持向量机
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于潜在语义主题融合的铁路扣件状态检测
被引量:6
- 7
-
-
作者
狄仕磊
刘甲甲
罗建桥
李柏林
-
机构
西南交通大学机械工程学院
-
出处
《传感器与微系统》
CSCD
2016年第7期19-21,25,共4页
-
基金
四川省科技支撑计划资助项目(2013GZ0032
2014GZ0005)
-
文摘
针对现有单一底层特征识别扣件状态的算法存在描述能力差、特征维度过高等问题,提出一种基于两种扣件底层特征的潜在语义主题融合的扣件检测模型。通过潜在狄利克雷分布(LDA)模型分别获取扣件图像的局部二值模式(LBP)特征和方向梯度直方图(HOG)特征的扣件语义主题向量。将这两种语义主题向量进行加权融合,权值由该图像LBP特征图和其梯度图的信息熵来确定。以该向量训练分类器,判断待检扣件状态。实验表明:与目前的主流扣件检测方法相比,该方法的漏检率和误检率明显降低,检测能力显著增强。
-
关键词
铁路扣件检测
语义主题
潜在狄利克雷分布模型
信息熵
加权融合
-
Keywords
railway fastener detection
semantic topics
latent Dirichlet allocation(LDA) model
information entropy
weighted fusion
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于最小二乘支持向量机的网页主题语义分类的研究
被引量:2
- 8
-
-
作者
樊中华
侯占斌
张晨星
马骁
-
机构
北京科技大学信息工程学院
北京航空航天大学计算机学院
-
出处
《计算机应用与软件》
CSCD
2009年第12期53-55,59,共4页
-
基金
国家"十一五"科技支撑计划项目(2006BAK11B03)
-
文摘
提出了对网页主题进行语义扩展的方法,利用最小二乘支持向量机LSSVM(least squares support vector machines)来代替传统的支持向量机SVM(support vector machine)的分类技术。在建立LSSVM模型的多类别分类算法基础上,将其应用到网页主题语义分类。实验表明,最小二乘支持向量机学习速度快,在小样本情况下具有良好的非线性建模和泛化能力,对网页主题语义分类具有很好的效果。
-
关键词
最小二乘支持向量机
语义建模
网页主题语义分类
-
Keywords
LSSVM Semantic modelling Semantic classification of webpage subjects
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于语义相关度主题爬虫的语料采集方法
被引量:6
- 9
-
-
作者
周昆
王钊
于碧辉
-
机构
中国科学院大学
中国科学院沈阳计算技术研究所
沈阳市国家税务局信息中心
-
出处
《计算机系统应用》
2019年第5期190-195,共6页
-
文摘
针对特定领域语料采集任务,设计了基于语义相关度主题爬虫的语料采集方法.根据选定的主题词,利用页面描述信息,基于维基百科中文语料训练出的词分布式表示综合HowNet计算页面信息相关度,结合URL的结构信息预测未访问URL链指的页面内容与特定领域的相关程度.实验表明,系统能够有效的采集互联网中的党建领域页面内容作为党建领域生语料,在党建领域网站上的平均准确率达到94.87%,在门户网站上的平均准确率达到64.20%.
-
关键词
生语料采集
语义相关度主题爬虫
页面信息相关度
URL结构信息
-
Keywords
corpus collection
semantic relevancy focused crawler
page information semantic relevancy
URL structural information
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于混合主题语义特征提取的旅游吸引物地理画像
被引量:1
- 10
-
-
作者
温梦甜
张岩
陈能成
陈泽强
-
机构
武汉大学测绘遥感信息工程国家重点实验室
中国地质大学(武汉)国家地理信息系统工程技术研究中心
-
出处
《地理与地理信息科学》
CSCD
北大核心
2022年第6期1-8,51,共9页
-
基金
国家重点研发计划项目(2018YFB2100500)
国家自然科学基金项目(41971351、41771422)。
-
文摘
通过刻画城市旅游吸引物地理画像,可为城市旅游吸引物建设和游客出行提供参考,但现有相关研究较少考虑到旅游吸引物的空间位置和配套设施等因素。该文提出从地理空间和地理语义两个角度构建城市旅游吸引物地理画像的方法,首先基于兴趣点(POI)数据通过隐式狄利克雷分布(LDA)模型提取主题语义特征,然后通过空间聚类分析旅游吸引物的空间格局,最后计算旅游吸引物集群的主题多样性,据此衡量游客对不同旅游目的地的满足度。以武汉市为研究区进行实验,结果表明:该文方法能客观地刻画旅游吸引物的配套设施建设情况,定量计算旅游吸引物集群的主题混合度和优势度,很好地融合了地理语义特征和地理空间关系,可为景区规划建设和游客选择旅游目的地提供参考。
-
关键词
旅游吸引物地理画像
LDA
POI
主题语义特征提取
主题多样性
-
Keywords
geographic portrait of tourism attractions
LDA
POI
theme semantic feature extraction
diversity of themes
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名主题语义域视角下的媒介批评话语分析
被引量:2
- 11
-
-
作者
彭汪鑫
-
机构
韩山师范学院外国语学院
-
出处
《惠州学院学报》
2017年第2期91-95,共5页
-
文摘
文章运用语料库驱动方法,从批评话语分析角度出发,通过比较英国新闻媒体对中国国家主席习近平访英报道、美国新闻媒体对习近平访美报道的主题语义域,分析立场异同,揭示其中的权力关系与意识形态。研究显示,英美媒体都为中国贴上了"独裁"、"人权危机"和"中国威胁论"的模式化标签;英媒对中英经贸合作前景相对乐观,但担心中英伙伴关系影响英美传统盟友关系;美媒对中美经贸合作前景不甚乐观,并刻意挑选网络安全和南海争端两大议题进行高频报道以对中国进行批判。
-
关键词
Wmatrix
主题语义域
批评话语分析
语料库
-
Keywords
Wmatrix
key semantic domains
critical discourse analysis
corpus
-
分类号
H059
[语言文字—语言学]
-
-
题名模块化网络主题语义分类算法的设计与仿真
- 12
-
-
作者
周瑛
刘仁芬
李娜
-
机构
石家庄铁道大学四方学院
-
出处
《计算机仿真》
北大核心
2022年第7期502-506,共5页
-
文摘
由于目前已有算法没有对网络主题语义流行度进行计算,构建流行度序列,导致分类结果不理想,运行时间增加。提出一种基于特征序列的模块化网络主题语义分类算法,通过Ochiia系数方法将高频关键词同时出现的次数转换为网络主题语义相似性。将语义相似性较强的网络主题聚集到一个簇中,形成主题簇。根据特征序列获取网络主题簇的平均热度和描述词,以此为依据构建流行度序列。采用特征序列对全部序列进行分类,实现模块化网络主题语义分类。仿真结果表明,所提算法能够快速准确完成模块化网络主题语义分类。
-
关键词
特征序列
模块化
网络主题语义
分类
-
Keywords
Feature sequence
Modularization
Network topic semantics
Classification
Ochiia coefficient
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于主题隐马尔科夫模型的人体异常行为识别
被引量:38
- 13
-
-
作者
朱旭东
刘志镜
-
机构
西安电子科技大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2012年第3期251-255,275,共6页
-
基金
国家自然科学基金(60573139)资助
-
文摘
针对基于监控视频的人体异常行为识别问题,提出了基于主题隐马尔科夫模型的人体异常行为识别方法,即通过无任何人工标注的视频训练集自动学习人体行为模型,并能够应用学到的人体行为模型实时检测异常行为和识别正常行为。这一方法主要围绕"低层视频表示-中层语义行为建模-高层语义分类"3个方面进行:1)基于时-空间兴趣点构建了一种紧凑的和有效的视频表示方法。2)提出一种新颖的语义主题模型(Topic Model,TM)——主题隐马尔科夫模型(Topic Hidden Markov Model,THMM),它能够自然地分组视频中检测到的人体行为。主题隐马尔科夫模型基于已有的马尔科夫模型和主题模型构造,不但聚类运动词汇成简单动作,而且聚类简单动作成全局行为,同时建模了行为时间上的相关性。THMM是一个4层贝叶斯主题模型,它将视频序列建模为行为的马尔科夫链,同时行为是视频序列中某些视频剪辑(Clip)的概率分布;将视频剪辑建模为动作的随机组合,同时动作是视频剪辑中运动词汇的概率分布。克服了传统隐马尔科夫模型和主题模型在人体复杂行为建模过程中精度、鲁棒性和计算效率上的不足。3)提出运行时累积的异常性测度及其在线异常行为检测方法和基于在线似然比检验(Likelihood Ratio Test,LRT)的实时正常行为分类方法,从而克服了实时行为识别过程中由于缺乏充分的视觉证据而引发的行为类型歧义,能完较好地完成监控场景中实时异常行为检测和在线正常行为识别的任务。取自实际监控场景的实验数据集上的实验结果证明了本方法的有效性。
-
关键词
计算机视觉
语义主题模型
异常检测
运动词包
行为聚类
-
Keywords
Computer vision, Topic model, Anomaly detection, Bag of motion word, Behavior clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于PLSA模型的Web页面语义标注算法研究
被引量:5
- 14
-
-
作者
王云英
-
机构
湘南学院图书馆
-
出处
《情报杂志》
CSSCI
北大核心
2013年第1期141-144,共4页
-
文摘
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。
-
关键词
语义标注
PLSA模型
潜在语义主题
标注算法
WEB页面
-
Keywords
semantic annotation PLSA model latent semantic topics annotation algorithm web pages
-
分类号
G350
[文化科学—情报学]
-
-
题名基于词汇树层次语义模型的图像检索算法
被引量:2
- 15
-
-
作者
张月辉
吴健
陆姗姗
崔志明
-
机构
苏州大学智能信息处理及应用研究所
-
出处
《微电子学与计算机》
CSCD
北大核心
2012年第11期172-176,共5页
-
基金
国家自然科学基金(60970015
61003054
+2 种基金
61170020)
江苏省高校自然科学研究项目(10KJB520018)
苏州市科技支撑计划项目(SG201257)
-
文摘
解决语义鸿沟必须建立图像低层特征到高层语义的映射,针对此问题,本文提出了一种基于词汇树层次语义模型的图像检索方法.首先提取图像包含颜色信息的SIFT特征来构造图像库的特征词汇树,生成描述图像视觉信息的视觉词汇.并在此基础上利用Bayesian决策理论实现视觉词汇到语义主题信息的映射,进而构造了一个层次语义模型,并在此模型基础上完成了基于内容的语义图像检索算法.通过检索过程中用户的相关反馈,不仅可以加入正反馈图像扩展图像查询库,同时能够修正高层语义映射.实验结果表明,基于该模型的图像检索算法性能稳定,并且随着反馈次数的增加,检索效果明显提升.
-
关键词
词汇树
语义主题信息
层次语义模型
语义映射
图像检索
-
Keywords
vocabulary tree
semantic subject information
hierarchical semantic model
semantic mapping
image retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名短句语义向量计算方法
被引量:3
- 16
-
-
作者
陈福
林闯
薛超
徐月梅
孟坤
倪艺函
-
机构
北京外国语大学计算机系
清华大学计算机系
-
出处
《通信学报》
EI
CSCD
北大核心
2016年第2期11-19,共9页
-
基金
国家自然科学基金资助项目(No.61170209
No.61173008
+3 种基金
No.61502038
No.61370132)
教育部新世纪优秀人才支持计划基金资助项目(No.NCET-13-0676)
2011重点课题基金资助项目(No.BFSU2011-ZS04)~~
-
文摘
提出了一种基于人工神经网络的短文语义向量放缩算法,结合社交节点自身信息和短文语义,给出社交网络短文语义计算方法和突发话题发现算法。通过文本数值化实现语义距离的计算、比较、节点的分类及社区发现等。通过自行开发的微博采集工具Argus采集的大量新浪微博内容对所提模型和算法进行了验证,最后对未来工作进行了展望。
-
关键词
在线社会网络
主题语义计算
人工神经网络
突发话题发现
-
Keywords
online social networks, theme semantic computing, artificial neural nets, burst topics discovering
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名主题地图约束的合法性验证
- 17
-
-
作者
吴笑凡
丁秋林
张磊
周良
-
机构
南京航空航天大学信息科学与技术学院
-
出处
《现代图书情报技术》
CSSCI
北大核心
2006年第3期36-41,共6页
-
基金
国防基础预研基金项目"某航空研究所并行工程"(项目编号:S0500A001)的研究成果之一。
-
文摘
主题地图作为异构信息检索的重要手段之一,在以分类目录为目的的文件存档和以概念化导航为目的的Web浏览中得到广泛应用。为了保证作为其基础的下层语义网络的完备性和健壮性,验证主题地图在语法和语义上的合法性非常重要。为此,提出了主题地图模式及约束语言规范,研究了Schema约束和上下文语义约束,并建立了与之相配套的主题地图语义验证器,实现了对于主题地图约束的合法性验证。
-
关键词
主题地图
模式及约束语言规范
Schema约束
上下文语义约束
主题地图语义验证器
-
Keywords
Topic Maps Schema and constraint language specification Schema constraints Contextual constraints TM validator
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于新型主题信息量化方法的Web主题信息提取研究
被引量:1
- 18
-
-
作者
吕聚旺
都云程
王弘蔚
施水才
-
机构
北京信息科技大学中文信息处理研究中心
北京拓尔思信息技术股份有限公司
-
出处
《现代图书情报技术》
CSSCI
北大核心
2008年第12期48-53,共6页
-
基金
国家863计划重点项目“跨媒体搜索关键技术研究及服务产品开发”(项目编号:2006AA010105)
国家自然科学基金项目“基于语义的中文文本聚类研究”(项目编号:60772081)
北京市属市管高校人才强教计划项目“创新团队-智能搜索引擎和文本挖掘”(项目编号:PXM2007_014224_044677)的研究成果之一
-
文摘
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息。实验证明本文提出的方法能够较好地解决主题信息自动提取存在的信息完整性和准确性的矛盾。
-
关键词
网页主题信息信息抽取信息块语义信息IB—DOM树
-
Keywords
Topic information of Web page
Information extraction
Information block
Semantic information
IB -DOM tree
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于LDA 模型与语义网络对评论文本进行挖掘
- 19
-
-
作者
谭瑾娜
-
机构
湘潭大学
-
出处
《信息与电脑》
2020年第21期58-60,共3页
-
文摘
本文基于LDA主题聚类与语义网络模型LTC-SNM的方法,依据客户价值理论对时尚租赁APP在线评论文本进行研究;对在线评价文本进行数据清洗和关键特征提取,使用Word2vec生成词向量,利用分类器对评价文本进行情感二分类,再通过LDA模型进行文本聚类,提取在线文本主题词转换为共线矩阵,最后利用ROSTCM软件生成语义网络图。实验结果表明:基于LTC-SNM的挖掘方法更能全方位地表达在线用户评论的主题。
-
关键词
时尚租赁
数据挖掘
LDA主题聚类语义网络模型
-
Keywords
fashion leasing
data mining
LDA topic clustering semantic network model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名大规模图像集中的代表性图像选取
被引量:2
- 20
-
-
作者
齐美彬
朱俊俊
纪平
蒋建国
-
机构
合肥工业大学计算机与信息学院
合肥学院电子信息与工程系
-
出处
《自动化学报》
EI
CSCD
北大核心
2014年第4期706-712,共7页
-
基金
国家自然科学基金(61172164)资助~~
-
文摘
针对传统图像检索系统通过关键字搜索图像时缺乏语义主题多样性的问题,提出了一种基于互近邻一致性和近邻传播的代表性图像选取算法,为每个查询选取与其相关的不同语义主题的图像集合.该算法利用互近邻一致性调整图像间的相似度,再进行近邻传播(AP)聚类将图像集分为若干簇,最后通过簇排序选取代表性图像簇并从中选取中心图像为代表性图像.实验表明,本文方法的性能超过基于K-means的方法和基于Greedy K-means的方法,所选图像能直观有效地概括源图像集的内容,并且在语义上多样化.
-
关键词
代表性图像
语义主题
互近邻一致性
AP聚类
图像簇排名
-
Keywords
Representative images, semantic theme, AP clustering, mutual nearest neighbor consistency, cluster ranking
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-