期刊文献+

高性能FTP搜索引擎的设计 被引量:7

The Design of High Performance FTP Search Engine
下载PDF
导出
摘要 FTP(file transfer protcol)搜索引擎的重点在于中文分词技术和检索技术。使用了一种面向FTP搜索优化的最大前向匹配分词算法,并将用户查询作为反馈来更新分词算法中所使用的字典,结合倒排索引技术实现了一个高性能的FTP搜索引擎的原型系统。压力测试结果表明此FTP搜索引擎具有很高的性能。 The key of FTP Search Engine is Chinese word segmentation and retrieval technique. We use a Forward Maximum Matching Chinese word segmentation algorithm optimized for FTP Search Engine, and take the retrieval keywords as feedback to update the dictionary affiliated with the segmentation algorithm. With the conbination of this scheme with the revert index technique, a high performance FTP Search Engine prototype is implemented. The results of load test have shown that the engine is of high performance.
作者 方冰 张一中
出处 《南京邮电大学学报(自然科学版)》 2007年第3期67-70,75,共5页 Journal of Nanjing University of Posts and Telecommunications:Natural Science Edition
关键词 FTP 搜索引擎 分词 倒排索引 file transfer protcol search engine word wegment revert index
  • 相关文献

参考文献11

  • 1陈华,李晓明.高级文件搜索引擎核心功能的实现技求[EB/OL].http://project.mytianwang.cn/document/ftp-core.htm
  • 2http://www.alltheweb.com
  • 3http://parker.vslib.cz
  • 4http://search.ustc.edu.cn(中科大天狼中英文搜索引擎)
  • 5http://bingle.pku.edu.cn(北大天网FTP搜索引擎)
  • 6http://sheenk.com/ftpsearch/search.html(FTP星空搜索)
  • 7http://e.100steps.net(华南理工大学百步梯FTP联盟搜索)
  • 8吴栋,滕育平.中文信息检索引擎中的分词与检索技术[J].计算机应用,2004,24(7):128-131. 被引量:48
  • 9王显芳,杜利民.一种能够检测所有交叉歧义的汉语分词算法[J].电子学报,2004,32(1):50-54. 被引量:13
  • 10RICARDO B Y,BERTHIER R N.Modern Information Retrieval[M].New York:Addison Wesley,1999.

二级参考文献11

  • 1孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量:87
  • 2[1]Richardo Baeza-Yates,Berthier Ribeiro-Neto.Modern Informatino Retrieval[M].New York:ACM Press,1999.
  • 3[2]I H Witten,A Moffat,T C Bell.Managing Gigabytes:Compressing and Indexing Document and Images[M].Van Nostrand Reinhold,New York,1994.
  • 4[3]Justin Zobel,Alistair Moffat,Ron Sack-Davis.An Efficient Indexing Technique for Full-text Database Systems[C].Proceedings of the 18th VLDB Conference Vancouver,British Columbia,Canada,1992.352-362.
  • 5[4]Gonzalo Navarro, Edleno Silva de Moura,Nivia Ziviani,et al.Adding Compression to Block Addressing Inverted Indices[J].Information Retrieval Journal,2000,3(1):49-77.
  • 6[5]赵鹏.基于数据压缩的信息检索技术的研究[D].哈尔滨:黑龙江大学,2000.
  • 7MitchellTM著 曾华军 张银奎译.机器学习[M].北京:机械工业出版社,2003..
  • 8Salton G, Wong A, Yang CS. On the specification of term values in automatic indexing[ J]. Journal of Documentation, 1973, 29 (4):351 - 372.
  • 9姚天顺 朱靖波.自然语言理解[M](第2版)[M].北京:清华大学出版社,2002..
  • 10孙茂松,左正平,邹嘉彦.高频最大交集型歧义切分字段在汉语自动分词中的作用[J].中文信息学报,1999,13(1):27-34. 被引量:51

共引文献64

同被引文献27

引证文献7

二级引证文献13

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部