期刊文献+

企业文档服务器中英文搜索引擎的设计与实现 被引量:1

The Design and Implementation of Chinese and English in Enterprise Document
下载PDF
导出
摘要 介绍了一个基于文档服务器的全文搜索引擎的设计及其实现,提出了一种用于企业文档服务器搜索引擎的基本框架,并对该搜索引擎主要功能模块的实现作了详细介绍,给出了相应的试验结果。系统采用文件实时动态监控和中文分词识别技术,使系统具有实时性和文档搜索有效性及准确性等优点。 This paper designs and implements a document full - text search engine. First, it proposes the framework of server - based searching engine, then the several major functional modules are implemented in detail, including file monitor, Chinese word segmentation, and so on. Through monitoring document status real -time and dynamically and segmenting Chinese words, the engine has greater efficiency and retrieval accuracy.
出处 《微处理机》 2009年第2期122-125,128,共5页 Microprocessors
关键词 搜索引擎 全文检索 中文分词 Search engine Full - text retrieval Chinese word segmentation
  • 相关文献

参考文献5

二级参考文献17

  • 1苏新宁.汉语词切分标引算法的改进[J].情报学报,1996,15(6):426-430. 被引量:9
  • 2Shkapenyuk V, Suel T. Design and Implementation of a High- performance Distributed Web Crawler. In Proceedings of the 18th International Conference on Data Engineering (ICDE'02), San Jose, CA, 2002:357-368
  • 3Cho J, Garcia-Molina H, Page L. Efficient Crawling Through Url Ordering. In 7^th Int. World Wide Web Conference, 1998
  • 4Chakrabarti S, van den Berg M, Dom B. Focused Crawling: A New Approach to Topic-specific Web Resource Discovery. In Proc. of the 8^th Int. World Wide Web Conference (WWW8), 1999
  • 5Rennie J, McCallum A. Using Reinforcement Learning to Spider the Web Efficiently. In Proc. of the Int. Conf. on Machine Learning (ICML),1999
  • 6Spertus E. Parasite: Mining Structural Information on the Web. In : Proc. of the Sixth Int'l World Wide Web Conf. , 1997
  • 7Cho J, Garcia-Molina H. The Evolution of the Web and Implications for an Incremental Crawler. In Proc. of 26th Int. Conf. on Very Large Data Bases, 2000:117-128
  • 8Henzinger M R, Heydon A, Mitzenmacher M, et al. on Near-uniform URL Sampling. In Proc. of the 9^th Int. World Wide Web Conference, 2000
  • 9Raghavan S, Garcia-Molina H. Crawling the Hidden Web. In Proc. of 27^th Int. Conf. on Very Large Data Bases, 2001
  • 10丁蔚.单汉字检索系统后控词表的改进研究[J].现代图书情报技术,1998(5):25-28. 被引量:15

共引文献113

同被引文献9

  • 1Tisseghem P,Fastrup L.深入索引和搜索引擎[M].北京:清华大学出版社,2009.
  • 2李晓明,闫宏飞,王继民.搜索引擎:原理、技术与系统[M].北京:科学出版社,2005.
  • 3Witten L H.Moffat A.深入搜索引擎--海量信息的压缩、索引和查询[M].北京:电子工业出版社,2009.
  • 4格拉夫,库辛.搜索引擎优化[M].杨明军译.北京:清华大学出版社,2007.
  • 5四衍思维,曹衍龙,赵斯思.PHP网络编程技术与实例[M].北京:人民邮电出版社,2006.
  • 6三扬科技.大道PHP:LAMP+Zend+开源框架整合开发与实战[M].北京:电子工业出版社,2009.
  • 7杨安生.基于倒排表的中文全文检索研究[J].情报探索,2009(7):77-80. 被引量:6
  • 8肖丽.哈希查找中散列函数的运用[J].技术与市场,2009,16(8):18-19. 被引量:3
  • 9郑榕增,林世平.基于Lucene的中文倒排索引技术的研究[J].计算机技术与发展,2010,20(3):80-83. 被引量:50

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部