期刊文献+

网页更新预测算法研究现状 被引量:2

Research Statue of Web Changing Prediction
下载PDF
导出
摘要 互联网的一个重要性质是网络中的网页信息随时发生着更新。在Web信息迅速增长的今天,网页更新的预测和确定成为了一个备受关注的课题。介绍了作为网页更新预测模型的泊松模型,并根据该模型的各种缺陷分析对网页更新预测算法的现状进行了阐述,同时对未来的研究方向进行了展望。 a very important property of Internet is that the webpage is changing all the time, how to detect and predict the change is now very important. In this paper, we discuss the Poisson process and analyze development situation of the prediction about the change of the pages. The future directions and some researching problems are also addressed.
作者 杨眉
出处 《软件导刊》 2013年第4期57-59,共3页 Software Guide
关键词 POISSON过程 网页更新预测算法 增量采集 The Change of Web Page Poisson Model Web Changing Prediction Incremental Crawler
  • 相关文献

参考文献16

  • 1中国互联网络信息中心.第27次中国互联网络发展状况统计报告[R],2011.
  • 2CHOJ,GARCIA-MOL1NA H. The evolution of the Web and implications for an incremental crawler[A].San Francisco,ca:morgan Kaufmann Publishers,2000.
  • 3CHO J,GARCIA-MOLINA H. Effective page refresh policies for Web crawlers[J].ACM Transactions on Database Systems,2003,(04).
  • 4CHO J,GARCIA-MOLINA H. Estimating frequency of change[J].ACM Transactions on Internet Technology,2003,(03).
  • 5刘凡,陈康,郑纬民.ChangeSpider:一个自适应的网页信息跟踪系统[J].计算机工程与应用,2003,39(34):160-164. 被引量:1
  • 6周艳;吴跃;鲁珂.Web搜索的网页更新检测算法研究[A]2009年西南地区网络与信息系统学术年会,2009.
  • 7程菲,汪建海,罗键.增量更新Crawler进行Web收集方法研究[J].计算机工程与科学,2006,28(12):28-30. 被引量:2
  • 8CASTILLO C,BAEZA-YATES R. A new model for Web craw ling[A].2002.
  • 9CHO J,NTOULAS A. Effective change detection using sampling[A].San Francisco:Morgan Kaufmann Publishers,2002.
  • 10QINGZHAO TAN,PRASENJITM1TRA. Clustering-based in cremental web crawling[J].ACM Transactions on Information Systems,2010,(03).

二级参考文献60

  • 1张志刚,陈静,李晓明.一种HTML网页净化方法[J].情报学报,2004,23(4):387-393. 被引量:57
  • 2孟涛,王继民,闫宏飞.网页变化与增量搜集技术[J].软件学报,2006,17(5):1051-1067. 被引量:22
  • 3程菲,汪建海,罗键.增量更新Crawler进行Web收集方法研究[J].计算机工程与科学,2006,28(12):28-30. 被引量:2
  • 4李魁,程学旗,郭岩,张凯.WWW论坛中的动态网页采集[J].计算机工程,2007,33(6):80-82. 被引量:11
  • 5KIM S J, LEE S H. An empirical study on the change of Web pages [ C]// Proceedings of the 7th Asia-Pacific Web Conference on Web Technologies Research and Development: APWeb 2005, LNCS 3399. Heidelberg: Springer-Verlag, 2005:632-642.
  • 6北大网络实验室.Web InfoMall[EB/OL].[2008-08-11].http://www.infomall.cn/.
  • 7CHO J, GARCIA-MOLINA H. Parallel crawlers[ C]// Proceedings of the 11th International Conference on World Wide Web: WWW 2002. New York: ACM Press, 2002: 124- 135.
  • 8CHO J, GARCIA-MOLINA H. The evolution of the Web and implications for an incremental crawler[ C]//Proceedings of the 26th International Conference on Very Large Databases. San Francisco: Morgan Kaufmann Publishers, 2000:200 - 209.
  • 9FETTERLY D, MANASSE M, NAJORK M, et al. A large-scale study of the evolution of Web pages[ C]// Proceedings of the 12th International Conference on World Wide Web. New York: ACM Press, 2003:669-678.
  • 10SALTON G, BUCKLEY C. Term-weighting approaches in automatic retrieval[ J]. Information Processing and Management, 1998, 24 (5): 513-523.

共引文献27

同被引文献14

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部