期刊文献+

基于Lucene的Ftp搜索引擎的设计 被引量:3

The Design of Ftp Search Engine Based on Lucene
原文传递
导出
摘要 针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文档,而且采用基于字典的前向最大匹配中文分词法在Lucene中动态更新全文索引。该设计还能够对检索关键字进行中英文混合分析和检索。 Since the Ftp search engine based on the database cannot dynamically support standard resource documents, Chinese words segmentation and updating database at present, this paper brings up a new design of Ftp search engine based on Lucene, a tool bag of a full text index engine with strong functions. And the new designed Ftp search engine can generate an XML resource documents by standard format automatically, thus maximally match Chinese words segmentation and update the full text index dynamically in the Lucene documents. In addition, the engine can also analyze the retrieval keywords both in Chinese and English.
出处 《图书情报工作》 CSSCI 北大核心 2006年第4期122-125,共4页 Library and Information Service
关键词 FTP搜索引擎 LUCENE XML 分词 Ftp search engine Lucene XML words segmentation
  • 相关文献

参考文献5

二级参考文献18

  • 1胡盈盈.单汉字标引与检索技术综析[M].南京大学信息管理系,..
  • 2张政保.全文数据库研究[M].中山大学,1995..
  • 3杨沛.全文数据库索引机制的比较研究[M].中国科技信息研究所,1995..
  • 4郭祥昊 李蕾.让搜索引擎灵起来[N].中国计算机报,2000-04-17.
  • 5Lucene 1.2-RC4 API.http://jakarta.apache.org/lucene/docs/api/index.html, 2002.
  • 6java offical web site.http://java.sun.com/,2002.
  • 7The Apache Jakarta Project:Lucene[EB/OL].http://jakarta.apache.org/lucene/,2003-04.
  • 8车东.在应用中加入全文检索功能--基于Java的全文索引引擎Lucene简介[EB/OL].http://www.chedong.com/tech/lucene.html,2002-08.
  • 9JavaCC[EB/OL].https://javacc.dev.java.net/,2003-04.
  • 10Katz H.JavaCC、解析树和XQuery 语法[EB/OL].http://www-900.ibm.com/developerWorks/cn/xml/x-javacc/part1/index.shtml,2002-12.

共引文献100

同被引文献15

引证文献3

二级引证文献13

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部