期刊文献+

基于Lucene构建的校园网黄页系统研究与实现

Design and Implementation of Campus Network Yellow Page System Based on Lucene
下载PDF
导出
摘要 网站黄页系统是一个自动生成网站黄页目录并以此为基础为用户提供一系列服务的系统。它通过快速收集网络上的教育资源,并自动化地对其进行高质量的分类和信息抽取,形成教育网站黄页,为用户提供浏览、检索等服务。未经过二次开发的黄页系统检索的准确性普遍较低,不适合校园网络的使用.针对普通搜索引擎的固有缺陷,提出了一种应用于新闻检索的搜索引擎,该引擎是利用开源的网络爬虫工具将互联网信息抓取到本地,并利用Lucene开放的API,对特定的信息进行索引和搜索。 Yellow page is a system that can automatically generate a directory of network to serve for users. Through rapid collection education resources on the network and high-quality automatic classification and information extraction,it generates a website directory to provide users with browsing, retrieving and other services.The search accuracy of yellow page without second development are generally lower, so it is unsuited to be used in campus network.In order to resolve the inherent vice about the general search engines, present a search engine applied in news search, which uses the web spider to fetch the information to local host. The search engine also uses the open API of Lucene to index and search the special information.
作者 郑羽
出处 《电脑开发与应用》 2014年第8期14-17,共4页 Computer Development & Applications
关键词 校园网 搜索引擎 黄页系统 网络爬虫 Lucene campus network Lucene search engine yellow page web spider
  • 相关文献

参考文献7

二级参考文献58

  • 1印鉴,陈忆群,张钢.搜索引擎技术研究与发展[J].计算机工程,2005,31(14):54-56. 被引量:53
  • 2郎小伟,王申康.基于Lucene的全文检索系统研究与开发[J].计算机工程,2006,32(4):94-96. 被引量:68
  • 3肖雪,何中市.基于向量空间模型的中文文本层次分类方法研究[J].计算机应用,2006,26(5):1125-1126. 被引量:12
  • 4杨晓江,李丽娟,田俊华,李艺.面向基础教育的Web资源垂直服务体系研究[J].中国远程教育,2006(07S):53-57. 被引量:4
  • 5蒋鸣和.《技术与课程整合》 9.24 厦门讲稿.ppt[Z].,..
  • 6柳栋.《网络教学环境的构成样式》.http://www.being.org.cn/sikao/eenv.htm,.
  • 7黎加厚.《为了我们民族的嘱托——让我国基础教育资源充分涌流》[M].,..
  • 8[1]Ester M, Kriegel HP, Schubert M. Web site mining: A new way to spot competitors, customers and suppliers in the world wide web.In: Hand D, ed. Proc. of the SIGKDD 2002. Edmonton: ACM Press, 2002. 249~258.
  • 9[2]Chakrabarti S, Joshi M, Tawde V. Enhanced topic distillation using text, markup tags, and hyperlinks. In: Kraft DH, ed. Proc. of the 24th ACM-SIGIR Conf. on Research and Development in Information Retrieval. New Orleans: ACM Press, 2001. 208~216.
  • 10[3]Chakrabarti S. Integrating the document object model with hyperlinks for enhanced topic distillation and information extraction. In:Shen VY, ed. Proc. of the WWW 2001. Hong Kong: ACM Press, 2001.211~220.

共引文献39

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部