-
题名基于逐点互信息的查询结构分析
被引量:3
- 1
-
-
作者
朱亚东
张成
俞晓明
程学旗
-
机构
中国科学院计算技术研究所
中国科学院研究生院
-
出处
《中文信息学报》
CSCD
北大核心
2012年第5期33-39,共7页
-
基金
国家自然科学基金资助项目(60903139
60873243
+2 种基金
60933005)
国家863计划重点项目(2010AA012502
2010AA012503)
-
文摘
Web搜索引擎中,对用户查询结构的有效分析,能更好地理解用户的查询意图,促进检索效果的提升。该文提出了一种简单高效的基于逐点互信息的查询结构分析方法,该方法包含了基于MapReduce的离线训练算法,以及一种自下向上的在线查询树构建算法。实验显示,该方法具有很高的切分速度,并能取得不错的可比较的切分效果。进一步的,该方法对检索性能的提升,也有明显的促进作用,在MAP,p@5,p@10评价指标上,都取得了不错的性能提升。
-
关键词
查询结构分析
MAPREDUCE
在线查询树
-
Keywords
query structure analysis
MapReduce~ online query analysis tree
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-