-
题名基于相似图片聚类的Web文本特征算法
被引量:3
- 1
-
-
作者
方爽
殷俊杰
徐武平
-
机构
武汉大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
2014年第12期161-165,171,共6页
-
文摘
对于图文不符的低质量网页,现有基于文本关键词的图片搜索引擎得到的结果相关性较差。针对该问题,将图片的相似性聚类信息和网页质量因素融入文本分析过程,提出一种基于相似图片聚类的Web文本特征算法。根据网页Page Rank值、关键词HTML标签类别和关键词词性类别的不同,分别赋予其不同的权重并代入计算公式,综合计算得到整个聚类中全部关键词的文本特征值,并通过设置阈值提取高相关文本。对随机选取的15个图片聚类进行实验分析,结果表明,与百度和谷歌目前所用图片搜索算法相比,该算法能够准确地找到反映图片内容的真实文本,提高图片检索的精度。
-
关键词
web文本特征
图片搜索引擎
基于文本的图像检索
基于内容的图像检索
倒排索引
web文本分析
-
Keywords
web text feature
image search engine
Text-based Image Retrieval(TBIR)
Content-based Image Retrieval
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-