一种高效的全文检索索引技术被引量：7

A Sort of Full-text Retrieval Technique with High Performance

下载PDF

导出

摘要针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析。 Discusses the popular word-based inverted file index model and the traits of index data,presents a run-length coding index compression algorithm,utilizing this compression coding,researches fast index creation process based on memory cache.Gives the comparative analysis of index expansion rate,creation time and search response speed by experiment,the result shows that this technique improves the index space and time efficiency.

作者陈玮陈玉鹏石晶陆达

机构地区清华大学光盘国家工程研究中心

出处《计算机应用研究》 CSCD 北大核心 2004年第7期35-37,40,共4页 Application Research of Computers

基金国家"973"重点基础研究发展规划项目 (G19990 330 )

关键词全文检索词索引内存缓存索引压缩 Full-text Retrieval Word-based Index Memory Cache Index Compression

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1[1]Richardo Baeza-Yates,Berthier Ribeiro-Neto.Modern Informatino Retrieval[M].New York:ACM Press,1999.
2[2]I H Witten,A Moffat,T C Bell.Managing Gigabytes:Compressing and Indexing Document and Images[M].Van Nostrand Reinhold,New York,1994.
3[3]Justin Zobel,Alistair Moffat,Ron Sack-Davis.An Efficient Indexing Technique for Full-text Database Systems[C].Proceedings of the 18th VLDB Conference Vancouver,British Columbia,Canada,1992.352-362.
4[4]Gonzalo Navarro, Edleno Silva de Moura,Nivia Ziviani,et al.Adding Compression to Block Addressing Inverted Indices[J].Information Retrieval Journal,2000,3(1):49-77.
5[5]赵鹏.基于数据压缩的信息检索技术的研究[D].哈尔滨:黑龙江大学,2000.

同被引文献39

1曾元鉴,李孝明.一个中文全文检索系统的设计与实现[J].计算机与数字工程,2004,32(3):12-15. 被引量：3
2张玉光.基于关系的全文检索[J].计算机研究与发展,1994,31(8):57-61. 被引量：9
3朱虹,吴林.倒排索引压缩及在RDBMS全文检索中的实现[J].华中科技大学学报（自然科学版）,2005,33(4):7-9. 被引量：3
4李世玲,司敬新.Web环境下国外医学文献全文检索的比较[J].现代情报,2005,25(6):219-221. 被引量：1
5宗宁.小型中文全文检索系统的设计与实现[J].电脑知识与技术,2005(5):12-14. 被引量：2
6江华,赵建新,王海岚.PAT数组全文检索技术的研究与改进[J].现代图书情报技术,2005(8):37-41. 被引量：2
7廖蓉,丁效柏.客房机—服务器模式的邮电法规全文信息检索系统[J].计算机与通信,1996(4):7-9. 被引量：2
8熊回香.全文检索中的汉语自动分词及其歧义处理[J].中国图书馆学报,2005,31(5):54-57. 被引量：6
9吴绍根.汉语自动分词模式自动机构造研究[J].现代图书情报技术,2006(5):47-49. 被引量：3
10靖培栋,宋雯斐.中文全文检索系统截词检索的实现研究[J].情报科学,2006,24(6):884-887. 被引量：4

引证文献7

1韩升,刘广志.全文检索系统的数据预处理研究[J].计算机技术与发展,2006,16(3):208-210. 被引量：3
2方雪华,刘祖润.中小型中文报刊全文数据库的建立及其应用[J].邵阳学院学报（自然科学版）,2006,3(1):60-62.
3吴绍根.基于模式自动机的自学习中文全文检索[J].现代图书情报技术,2006(7):25-28.
4方冰,张一中.高性能FTP搜索引擎的设计[J].南京邮电大学学报（自然科学版）,2007,27(3):67-70. 被引量：7
5陈金龙.分布式FTP并行搜索引擎的设计与实现[J].计算机时代,2008(7):70-71. 被引量：2
6杨安生.基于倒排表的中文全文检索研究[J].情报探索,2009(7):77-80. 被引量：6
7李致远,冯琳.一种基于Lucene的高效索引建立方法[J].工业控制计算机,2020,33(1):77-78. 被引量：4

二级引证文献22

1张才俊,江帆,张波.基于改进型B+树的电力多模态数据索引系统研究[J].系统仿真技术,2023,19(4):302-307.
2赵旭,陈肖飞.基于Web的高校FTP搜索引擎的技术研究[J].电脑知识与技术（过刊）,2007(22):966-967. 被引量：1
3许君,王朝坤,李瑞,王建民,刘璋.基于内容的分布式FTP搜索引擎的设计与实现[J].计算机研究与发展,2011,48(S3):430-434. 被引量：5
4熊回香,夏立新.基于词索引的中文全文检索关键技术及其发展方向[J].中国图书馆学报,2007,33(4):45-49. 被引量：6
5熊回香,夏立新.汉语分词技术综述[J].图书情报工作,2008,52(4):81-84. 被引量：9
6陈金龙.分布式FTP并行搜索引擎的设计与实现[J].计算机时代,2008(7):70-71. 被引量：2
7钮焱,黎冬.基于客户反馈的FTP搜索引擎模型设计[J].湖北工业大学学报,2008,23(5):15-17. 被引量：2
8易清亮,刘克剑,蔡祖恋.基于P2P技术的大型分布式FTP搜索引擎研究[J].广西师范大学学报（自然科学版）,2010,28(1):117-121. 被引量：3
9刘文婷,滕奇志.后缀树聚类在专用搜索引擎中的应用研究与改进[J].成都信息工程学院学报,2010,25(3):269-274. 被引量：2
10王荣德,荆一楠,王欢,高海锋.基于时间戳索引的日志文件并行检索技术研究[J].计算机应用与软件,2011,28(2):145-147. 被引量：3

1江宇,姜琨,宋省身,杨岳湘.倒排链表多层自索引结构的分析与设计[J].计算机应用研究,2017,34(2):473-476.
2程鹏.位图索引技术及其研究综述[J].科技信息,2010(26):134-135. 被引量：2
3张旭东,孙志明,刘亚宁,单栋栋,闫宏飞.基于64位体系结构的倒排索引压缩算法[J].计算机工程,2014,40(2):71-76. 被引量：5
4陈震,刘洪健.基于倒排列表的网流索引检索与压缩方法[J].信息网络安全,2014(4):25-30. 被引量：2
5毛福林,瞿有利.一种变长编码压缩倒排索引算法[J].山东大学学报（理学版）,2014,49(12):30-35.
6朱虹,吴林.倒排索引压缩及在RDBMS全文检索中的实现[J].华中科技大学学报（自然科学版）,2005,33(4):7-9. 被引量：3
7罗晟.号码百事通文本搜索引擎设计及优化对策[J].武汉理工大学学报,2009,31(24):102-105.
8罗备针.倒排文档在FOXBASE上的实现[J].云南软件产业,1991(1):22-28.
9刘明政,蔡小芳.利用倒排文档实现基于内容的图像检索[J].计算机与数字工程,2009,37(7):143-146. 被引量：1
10蔡新华.一种倒排文挡的结构和算法设计[J].中文信息,1991(2):73-74.

计算机应用研究

2004年第7期

浏览历史

内容加载中请稍等...

一种高效的全文检索索引技术被引量：7

参考文献5

同被引文献39

引证文献7

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

一种高效的全文检索索引技术 被引量：7

参考文献5

同被引文献39

引证文献7

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

一种高效的全文检索索引技术被引量：7