期刊文献+

一种基于Lucene的面向主题爬行搜索引擎的研究 被引量:1

下载PDF
导出
摘要 本文简要介绍了主题搜索的基本概念以及Lucene的基本结构。研究了面向主题搜索引擎的实现和优化,提出了JE中文分词实现方法,主题索引系统的构建,完成了一个高性能的主题搜索引擎系统。
作者 严良达
出处 《福建电脑》 2013年第5期24-25,共2页 Journal of Fujian Computer
基金 浙江工商职业技术学院科研基金项目:一种基于Lucene的面向主题爬行搜索引擎的研究
  • 相关文献

参考文献4

二级参考文献16

  • 1赫枫龄,左万利.利用超链接信息改进网页爬行器的搜索策略[J].吉林大学学报(信息科学版),2005,23(1):59-63. 被引量:8
  • 2SuGuiyang LiJianhua MaYinghua LiShenghong SongJuping.New focused crawling algorithm[J].Journal of Systems Engineering and Electronics,2005,16(1):199-203. 被引量:1
  • 3Nutch:The Java Search Engine[Z].[2009-05-18].http://lucene.apache.org/nutch.
  • 4Dean J,Ghemawat S.MapReduce:Simplified Data Processing onLarge Clusters[Z].2004.
  • 5Castillo R,Matin C,Rodriguez M.Crawling a Country:BetterStrategies than Breadth-first for Web Page Ordering[J].ACM Transactions on Database Systems,2005,23(4):864-872.
  • 6JE-analysis[Z].[2009-06-03].http://www.jesoft.cn.
  • 7Fetterly D, Manasse M, Najork M, et al. A Large-scale Study of the Evolution of Web Pages [ C ]//Proceedings of the 12th International World Wide Web Conference. Budapest, Hungary: ACM Press, 2003: 669-678.
  • 8Cho J, Garcia-Molina H, Page L. Efficient Crawling through URL Ordering [ J ]. Computer Networks, 1998, 30 (1/7) : 161-172.
  • 9Menczer F. Complementing Search Engines with Online Web Mining Agents [ J ]. Decision Support Systems, 2003, 35(2) : 195-212.
  • 10SONG Rui-hua, LIU Hai-feng, WEN Ji-rong, etal. Learning Block Importance Models for Web Pages [ C ]//The Thirteenth World Wide Web Conference (WWW 2004). New York: ACM Press, 2004: 203-211.

共引文献9

同被引文献2

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部