期刊文献+

基于Python的中药材价格信息爬虫的设计 被引量:3

Design of Crawler for Price Information of Chinese Medicinal Materials Based on Python
下载PDF
导出
摘要 为了收集大量、真实、可靠的中药材价格信息,为中药材价格的预测研究提供强有力的数据支撑。将数据来源方向瞄向互联网,在前期筛选的基础上,最终确立以中药材天地网为目标网站。在深入分析目标网站结构的基础上,基于Python语言设计了一款中药材价格信息爬虫。详细介绍了爬虫模拟请求网页、目标信息提取、信息存储及定时启动部署等环节的实现方法。实际测试结果显示,所设计的爬虫运行稳定,能高效、完整无误的抓取目标网站的信息条目。 In order to collect a large number of real and reliable price information of Chinese herbal medicines,and provide a strong data support for the price prediction of Chinese herbal medicines.With Internet data as the source,on the basis of pre-screening,the final establishment of Chinese herbal medicine Tiandi Web site as the goal.Based on the in-depth analysis of the target website structure,a price information crawler of Chinese medicinal materials was designed based on Python language.The implementation methods of web page simulation request,target information extraction,information storage and timing start deployment are introduced in detail.The actual test results show that the designed crawler runs steadily and can capture the information items of the target website efficiently and completely.
作者 张喜红 ZHANG Xi-hong(Department of Intelligent Engineering,Bozhou Vocational and Technical College,Bozhou 236800,China)
出处 《枣庄学院学报》 2019年第2期67-72,共6页 Journal of Zaozhuang University
基金 安徽省高校优秀青年人才支持计划项目(gxyq2018215) 安徽省高校自然科学研究重大项目(KJ2016SD41)
关键词 PYTHON 中药材 爬虫 Python Chinese medicinal materials spider
  • 相关文献

参考文献13

二级参考文献88

  • 1杨学明,刘柏嵩.主题爬虫在数字图书馆中的应用[J].图书馆杂志,2007,26(8):47-50. 被引量:3
  • 2周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969. 被引量:153
  • 3夏崇镨,康丽.基于叙词表的主题爬虫技术研究[J].现代图书情报技术,2007(5):41-44. 被引量:8
  • 4徐远超,刘江华,刘丽珍,关永.基于Web的网络爬虫的设计与实现[J].微计算机信息,2007,23(21):119-121. 被引量:36
  • 5维克托·迈尔-舍恩伯格,肯尼迪·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.
  • 6Alberto Cavallo. Massachusetts Institute of Technology, Sloan School of Management. Online and Official price indexes: Mesuring Argentina' s inflation.
  • 7MarkJasonDominus著,滕家海译.高阶Perl[M].北京:机械工业出版社.2013.
  • 8薛毅,陈丽萍.统计建模与R软件[M].北京:清华大学出版社.2006.
  • 9徐金祥.统计指数理论、方法与应用研究[M].上海:上海人民出版社,2011.
  • 10JefferyE.F.Friedl著,余晟译.精通正则表达式(第3版)[M].北京:电子工业出版社.2008.

共引文献226

同被引文献18

引证文献3

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部