摘要
搜索引擎是人们在网上获取知识的一个重要工具。本文构建了一个基于Lucene的全文检索框架,并以此实现了一个对局域网信息进行全文检索的搜索引擎。它可以方便的嵌入到各种应用中,实现针对应用的全文索引/检索功能。通过对局域网存储的各种文本文件,如PDF,MS Word,HTML等,音频文件如MP3等进行遍历,将相应的文件信息存储在数据库中,通过数据库的记录进行对应文件的信息抽取,建立相应的索引,同时进行中文分词等处理,在前台利用Web服务器提供一个B/S结构的查询界面,向用户提供局域网内的全文检索服务。
出处
《黑龙江纺织》
2007年第3期37-41,共5页
Heilongjiang Textiles