摘要
对开源全文检索引擎Lucene的系统架构、索引与检索过程、语言分析器进行分析的基础上,针对其对中文只能进行单字切分、双字切分的不足,二次开发基于Lucene中英文语言分析器ZH_CNAnalyzer,并给出一个调用此分析器建立索引与检索的实例。
This paper introduces the system architecture, indexing and retrieval process, and language analyzer of Lucene. According to the disadvantage of Lueene that it can only make one - word and two - word segmentation, this paper develops a Chinese - English language analyzer -- ZH_CNAnalyzer. At last, an indexing and retrieval example of ZH_ CNAnalyzer is given.
出处
《现代图书情报技术》
CSSCI
北大核心
2009年第4期19-22,共4页
New Technology of Library and Information Service
基金
石家庄学院社会科学重点基金项目"面向学科服务的Web多媒体智能搜索平台"(项目编号:2007032)的研究成果之一