摘要
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 。
Discusses the popular word-based inverted file index model and the traits of index data,presents a run-length coding index compression algorithm,utilizing this compression coding,researches fast index creation process based on memory cache.Gives the comparative analysis of index expansion rate,creation time and search response speed by experiment,the result shows that this technique improves the index space and time efficiency.
出处
《计算机应用研究》
CSCD
北大核心
2004年第7期35-37,40,共4页
Application Research of Computers
基金
国家"973"重点基础研究发展规划项目 (G19990 330 )
关键词
全文检索
词索引
内存缓存
索引压缩
Full-text Retrieval
Word-based Index
Memory Cache
Index Compression