摘要
随着高校校园网的建设日趋成熟,校园网内部的数据信息量大幅增长,为了提高信息检索的准确性和效率,本文在研究垂直搜索引擎的相关原理、技术和实现过程的基础上,探讨如何利用开源的Heritrix爬虫工具包、Lucene全文搜索工具包、JE-analysis中文分词组件和Htmlparser解析工具包实现校园网搜索引擎系统。
基金
浙江工业大学校自然科学基金“校园网搜索引擎的研究与开发”(项目编号110313033408)
浙江省图书馆学会课题“图书馆资源定位及增值服务研究(项目编号Ztx2013B-18)的研究成果之一