期刊文献+

基于R语言爬虫技术的网页信息抓取方法研究——以抓取二手房数据为例 被引量:4

下载PDF
导出
摘要 随着互联网的快速发展,大数据时代的来临,网络上的数据和信息呈爆炸性增长,网络爬虫技术越来越受欢迎。本文通过以抓取二手房出售数据为例,探索R语言爬虫技术的网页信息抓取方法,发现基于R语言的rvest函数包与Selector Gadget工具实现的网页信息爬取方法比传统方法更加简单快捷。
出处 《科技风》 2019年第6期54-54,56,共2页
  • 相关文献

参考文献2

二级参考文献25

  • 1李卫,刘建毅,何华灿,王枞.基于主题的智能Web信息采集系统的研究与实现[J].计算机应用研究,2006,23(2):163-166. 被引量:15
  • 2MURRAY B,MOORE A.Sizing the Internet[M].[S.l.]:Cyveillance Inc,2000.
  • 3LAWRENCE S,GILES L.Accessibility and distribution of information on the Web[J].Nature,1999,400(8):107-109.
  • 4CHO J,CARCIA M H.The evolution of the Web and implication for an incremental crawler[C]//Proc of the 26th International Conference on Very Large Databases (NVLDB-00).2000.
  • 5BREWINGTON B E,CYBENKO C.How dynamic is the Web[C]//Proc of the 9th International World Wide Web Conference.2000.
  • 6MENCZER F,PANT C,RUIZ M E.Evaluating topic-driven Web crawlers[C]//Proc of SIGIR'01.New Orleans,Louisiana:[s.n.],2001:241-249.
  • 7MENCZER F,PANT C,SRINIVASAN P.Topic-driven crawlers:machine learning issues[EB/OL].(2002-05-15).http://dollar.biz.uiowa.edu/-fil/papers.html.
  • 8CHO J,GARCIA M H,PAGE L.Efficient crawling through URL ordering[J].Computer Networks and ISDN Systems,1998,30(1-7):161-172.
  • 9DeBRA P,HOUBEN G,KORNATZKY Y,et al.Information retrieval in distributed hypertexts[C]//Proc of the 4th RIAO Conference.New York:[s.n.],1994:481-491.
  • 10HERSOVICI M,JACOVI M,MAAREK Y S,et al.The shark-search algorithm:an application:tailored Web site mapping[C]//Proc of the 7th International World Wide Web Conference.Brisbane:[s.n.],1998:65-74.

共引文献132

同被引文献19

引证文献4

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部