期刊文献+

基于Tika语义分析的文档内容检索服务研究 被引量:1

RESEARCH OF DOCUMENT RETRIEVAL SERVICE BASED ON TIKA SEMANTIC ANALYSIS
下载PDF
导出
摘要 介绍了利用Lucene结合Tika实现站点内容的全文检索设计的编程过程。用Tika获取文档的元数据以及文档内容的文本提取。用Lucene实现文档的索引创建和检索服务,结合实例详细分析了Lucene API的具体使用特点。利用Spring MVC实现搜索服务的Web访问处理。可对网站的HTML、PDF、word、PPT、mht等各种类型的文档提供统一的内容检索服务。在该论文研究基础上可建立个性化的内容搜索服务系统。 The programming process of full text retrieval design exploiting Lucene and Tika is introduced. Tika is used for get Metadata and extract text from documents. The index creating and retrieval service is realized by Lucene, we analyze the specific characteristics of Lucene API. Web access processing of search service is implemented using Spring MVC. The service can provide uniform retrieval service for documents in forms of HTML, PDF, WORD, PPT, mht and so on in web sites. Personalized content retrieval service system can be created based on this paper.
作者 丁振凡
出处 《井冈山大学学报(自然科学版)》 2013年第2期60-64,共5页 Journal of Jinggangshan University (Natural Science)
关键词 SPRING MVC LUCENE Tika 文档元数据 全文检索 spring MVC lucene tika document metadata full text retrieval
  • 相关文献

参考文献9

二级参考文献46

共引文献262

同被引文献8

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部