-
题名基于链接描述文本及其上下文的Web信息检索
被引量:22
- 1
-
-
作者
张敏
高剑峰
马少平
-
机构
清华大学智能技术与系统国家重点实验室
微软亚洲研究院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第1期221-226,共6页
-
基金
国家"九七三"重点基础研究发展规划项目 (G19980 3 0 5 0 9)
国家自然科学基金项目 ( 60 2 2 3 0 0 4)
国家"八六三"高技术研究发展计划基金项目 ( 2 0 0 1AA114 0 82 )
-
文摘
文档之间的超链接结构是Web信息检索和传统信息检索的最大区别之一 ,由此产生了基于超链接结构的检索技术 描述了链接描述文档的概念 ,并在此基础上研究链接文本 (anchortext)及其上下文信息在检索中的作用 通过使用超过 16 9万篇网页的大规模真实数据集以及TREC2 0 0 1提供的相关文档及评价方法进行测试 ,得到如下结论 :首先 ,链接描述文档对网页主题的概括有高度的精确性 ,但是对网页内容的描述有极大的不完全性 ;其次 ,与传统检索方法相比 ,使用链接文本在已知网页定位的任务上能够使系统性能提高 96 % ,但是链接文本及其上下文信息无法在未知信息查询任务上改善检索性能 ;最后 ,把基于链接描述文本的方法与传统方法相结合 ,能够在检索性能上提高近 16 %
-
关键词
链接文本
链接描述文档
WEB信息检索
-
Keywords
anchor text
anchor description document
web information retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于链接结构分析的Web信息检索方法研究
被引量:7
- 2
-
-
作者
宋玲玲
李村合
-
机构
滨州职业学院
中国石油大学(华东)
-
出处
《现代情报》
北大核心
2007年第2期133-135,137,共4页
-
文摘
随着信息技术的发展,特别是互联网技术的不断普及,网上信息数量成指数级增长。如何准确有效地从海量信息中检索出所需的信息,成为一个重要而迫切的研究课题。文中针对基于链接结构分析的Web信息检索方法进行了分析和研究,提出了一种改进的超链接主题查找算法——SAHITS,经过实验验证,改进后的算法更符合人们的一般期望,能有效地提高信息检索系统的查准率。
-
关键词
WEB信息检索
链接结构分析
链接描述文档
SAHITS算法
-
Keywords
web information retrive
link structure analysis
link description document
SAHITS-algorithm
-
分类号
G354.4
[文化科学—情报学]
-