期刊文献+

全站点内容定位搜索的研究与实现

Researches and realization on full-site content retrieval method
下载PDF
导出
摘要 提出并实现了一种基于Lucene的全站点内容搜索方法,其搜索内容主要针对某个组织机构管理下的所有网站服务器上的信息内容,包括静态网页信息、动态网页中的表单信息以及附件文档内容。文中介绍了全站点内容搜索的设计思想、架构设计和具体实现,并根据实验结果验证全站点内容搜索的实用性和效率。 A full-site content retrieval method is proposed and developed which can be used to search all content on enterprise or institution websites, including static web pages, dynamic web form and attachment documents. The concept design, architecture design and realization for the retrieval method are introduced. The experiment results prove the practicality and efficiency of the full-site content retrieval method.
作者 孙瑶 赵逢禹
出处 《信息技术》 2013年第10期134-138,共5页 Information Technology
关键词 全站点搜索 网站 内容检索 组织机构 full-site searching websites content retrieval enterprise and organization
  • 相关文献

参考文献11

  • 1站内搜索[EB/OL].http://baike.baidu.corn/view/2297577.htm.
  • 2富羽鹏,张敏,马少平.企业与内联网信息检索方法概述[J].广西师范大学学报(自然科学版),2007,25(2):90-98. 被引量:5
  • 3何世林.基于Java技术的搜索引擎研究与实现[J].CNKI,2006,20(7):23-25.
  • 4李岩,陈新中,杨炳儒.基于Web挖掘的智能门户搜索引擎的研究[J].计算机工程与应用,2002,38(4):34-36. 被引量:36
  • 5AnaonRungsawang, BunditManaskasemsak. Partition-Based Parallel PageRank Algorithm[ J]. IEEE Trans. on Information Technology and Applications. 2005,2(4) :57 -62.
  • 6KristinnSiguresson. Adaptive Revisiting with Heritrix [ C ]. May. 2005:13 -14.
  • 7htmlparser [ EB/OL ]. http ://baike. baidu, corn/view/117449 I. htm.
  • 8吴代文.基于Lucene全文检索应用研究[J].微计算机应用,2011,32(2):62-65. 被引量:2
  • 9Lueene[ EB/OL] . http ://baike. baidu, corn/view/371811, htm.
  • 10Brin S, Page L. The anatomy of a large-scale hypertextual Web search engine[ J ]. Computer Networks, 1998, 30 ( 1 - 7 ) : 107 - 117.

二级参考文献37

  • 1王学松.Lucene+nutch开发搜索引擎[M].北京:人民邮电出版社,2008.
  • 2郑轶嫒.基于J2EE的站内搜索引擎的研究[D].上海交通大学.2005.1:8-13.
  • 3高斯帕那,哈特赫(著),谭鸿,黎俊鸿等(译).LuceneINACTION中文版[M].北京:电子工业出版社,2007.1.
  • 4中国互联网络信息中心.第14次中国互联网络发展状况统计报告[R/OL].北京:中国互联网络信息中心,2004[2006-12-15].http://www.cnnic.net.cn/download/2004/2004072002.pdf.
  • 5RAGHAVAN P.Structured and unstructured search in enterprises[J].Bulletin of the Technical Committee on Data Engineering,2001,24(4):15-18.
  • 6KUMAR R,RAGHAVAN P,RAJAGOPALAN S,et al.The Web and social networks[J].Computer,2002,35(11):32-36.
  • 7FELDMAN S.The high cost of not finding information[EB/OL].(2004-03-01)[2006-12-15].http://www.kmwor-ld.com/Articles/PrintArticle.aspx?ArticleID=9534.
  • 8MUKHERJEE R,MAO Jian-chang.Enterprise search:tough stuff.Queue,2004,2(2):36-46.
  • 9BRIN S,PAGE L.The anatomy of a large-scale hypertextual Web search engine[C]//Proceedings of the 7th International Conference on World Wide Web.Amsterdam:Elsevier Science Publishers,1998:107-117.
  • 10DAVID H.Challenges in enterprise search[C]//Proceedings of the 15th Australasian Database Conference:Volume 27.Darlinghurst:Australian Computer Society,2004:15-24.

共引文献50

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部