期刊文献+

基于Scrapy的研招网硕士目录爬虫的设计与实现 被引量:3

下载PDF
导出
摘要 研招网作为中国最大的研究生招考信息公布平台,资源丰富。目前主流的爬虫框架有Scrapy、pyspider与crawley,其中Scrapy为目前最流行的爬虫框架。因此,文中主要研究Python语言开发的开源爬虫框架Scrapy所开发的爬虫,对研招网硕士目录进行爬取,举例说明爬虫如何应对网站的反爬措施。
出处 《电脑知识与技术》 2022年第17期53-55,共3页 Computer Knowledge and Technology
基金 2020年湖南省大学生实践创新训练项目:校园东街微信小程序的设计与开发(项目编号:S202010555141)。
  • 相关文献

参考文献5

二级参考文献27

  • 1郑冬冬,赵朋朋,崔志明.Deep Web爬虫研究与设计[J].清华大学学报(自然科学版),2005,45(S1):1896-1902. 被引量:28
  • 2郑冬冬,崔志明.Deep Web爬虫爬行策略研究[J].计算机工程与设计,2006,27(17):3154-3158. 被引量:13
  • 3http://zh.wikipedia.org/wiki/Python.
  • 4www.mysql.com.
  • 5www.python.org.
  • 6http://mysql-python.sourceforge.net/MySQLdb.html.
  • 7[2]Michelangelo Diligenti,Frans Coetzee,Steve Lawrence,et al.Focused Crawling using Context Graphs[J],Intemational Conference on Very Large Databases.2002,(26):527-534.
  • 8黄萱菁,吴立德.独立于语种的文本分类方法[J].2000 International Conference on Multilingual Information Processing,2000,:37-43.
  • 9鲁松,白硕.文本中词语权重计算方法的改进[J].2000 International Conference on Multilingual Information Proeessing,2000,:31-36.
  • 10[5]Google 的 PageRank 算法[EB/OL].[2003-12-18].http://blog.xdanger.com/archives/2003/12/18/000046.html.

共引文献76

同被引文献16

引证文献3

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部