摘要
检索效率对大规模信息检索系统至关重要 .本文基于Web搜索应用背景 ,针对用户查询的统计特性 ,提出了一种分块组织倒排文件的方法 .通过建立检索性能模型 ,进行分析和仿真实验 ,结果表明这一方法下的检索算法可以有效的减少检索执行时间 ,并得到这一组织方式中分块参数的优化选择方法 .
The efficiency of retrieval system is crucial for large scale information retrieval systems.By analyzing the documents and the users' query logs of a real search engine,a blocking inverted file structure is proposed.Simulation results show that the retrieval algorithm under the new organization of the inverted file can decrease its execution time significantly,and the optimal parameter selection for this blocking organization is discussed.
出处
《电子学报》
EI
CAS
CSCD
北大核心
2005年第2期358-362,共5页
Acta Electronica Sinica
基金
国家 973计划项目 (No G1 9990 32 70 6)
教育部博士点基金 (No 2 0 0 30 0 0 1 0 76)
关键词
搜索引擎
信息检索
倒排文件
检索效率
search engine
information retrieval
inverted file
retrieval efficiency