新冠肺炎疫情信息累积更新采集系统的设计与实现被引量：1

Design and Implementation of COVID-19 Information Cumulation Update Collection System

下载PDF

导出

摘要突如其来的新冠肺炎疫情打乱了人们的正常生活和工作节奏,面对各种不同来源的新冠肺炎疫情数据,如何及时获取疫情信息这对人们的工作、生活有很大帮助。本文使用Python编程语言,结合Scrapy框架,基于Splash对页面中的JavaScript代码进行渲染的技术,设计并实现了一种新冠肺炎疫情信息累积更新采集系统。实验表明,该系统能同时采集国内31个省(自治区、直辖市)官方网站发布的疫情数据,并能累积更新。同时,将采集的数据清洗后存入数据库中,为下游任务疫情数据可视化、趋势预测等提供数据支撑。 The sudden COVID-19 epidemic has disrupted people′s normal life and work rhythm.In the face of COV⁃ID-19 epidemic data,how to timely obtain the epidemic information is of great help to people′s work and life.This paper uses python programming language,combined with scrapy framework,based on splash to render the JavaScript code in the page,designs and implements a collection system for cumulative update of new epidemic information.The experimental results show that the system can simultaneously collect the epidemic data published by official websites of 31 provinces(autonomous regions and municipalities)at the same time,and accumulate and update them.At the same time,the collected data are stored in the database after clearing the method,which provides data support for the visualization and trend prediction of epidemic situation data in downstream tasks.

作者王君马乐荣 WANG JUN;MA Le-rong(School of Mathematics and Computer Science,Yan′an University,Yan′an 716000,China)

机构地区延安大学数学与计算机科学学院

出处《延安大学学报（自然科学版）》 2021年第2期96-99,共4页 Journal of Yan'an University：Natural Science Edition

基金国家自然科学基金资助项目(61866308) 延安市高层次人才专项项目(203010096) 延安大学研究生教育创新计划项目(YCX2020104)。

关键词新冠肺炎疫情数据累积更新数据爬虫 COVID-19 epidemic data cumulative update data crawler

分类号 TP3111 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1刘哲,马乐荣.大规模电商平台商品信息采集系统的设计与实现[J].延安大学学报（自然科学版）,2020,39(2):32-36. 被引量：9

二级参考文献5

1彭纪奔,吴林,陈贤,黄雷君.基于爬虫技术的网络负面情绪挖掘系统设计与实现[J].计算机应用与软件,2016,33(10):9-13. 被引量：15
2杜泽宇,杨燕,贺樑.基于中文知识图谱的电商领域问答系统[J].计算机应用与软件,2017,34(5):153-159. 被引量：38
3宗平,李雷.PostgreSQL与MongoDB处理非结构化数据性能比较[J].计算机工程与应用,2017,53(7):104-108. 被引量：23
4周俊鹏,高岭,曹瑞,高全力,郑杰,王海.基于商品评论的群体用户情感趋势预测研究[J].郑州大学学报（理学版）,2019,51(4):23-29. 被引量：7
5丁晟春,侯琳琳,王颖.基于电商数据的产品知识图谱构建研究[J].数据分析与知识发现,2019,3(3):45-56. 被引量：23

共引文献8

1刘哲,马乐荣.基于淘宝平台的笔记本电脑商品知识发现[J].延安大学学报（自然科学版）,2020,39(4):63-66. 被引量：1
2黎洋,周橙旻,李明坤,李晓刚.数据采集在小件电商家具市场分析中的应用[J].家具,2021,42(3):113-118. 被引量：11
3叶文全.基于Chrome扩展的跨境电商选品上架程序化实现[J].宁德师范学院学报（自然科学版）,2021,33(2):159-165.
4廖美红,陆莹.面向大规模电商平台的商品信息采集技术研究[J].企业科技与发展,2022(6):66-68.
5陈霖.基于区块链的跨境电商综合服务系统设计[J].信息与电脑,2022,34(18):13-15.
6先梦瑜.一种基于Dijkstra的物流配送路径优化算法设计[J].电子设计工程,2023,31(2):20-24. 被引量：5
7刘哲,潘梦瑶,宋佳豪,马乐荣.三维课表自动生成系统的设计与实现[J].信息与电脑,2023,35(9):249-251.
8刘哲,宋佳豪,潘梦瑶.电子校历自动生成系统的设计与实现[J].现代计算机,2023,29(11):109-112.

同被引文献6

1郝爽,李国良,冯建华,王宁.结构化数据清洗技术综述[J].清华大学学报（自然科学版）,2018,58(12):1037-1050. 被引量：75
2陈小巧.西方信息图表的崛起[J].设计,2015,28(10):132-133. 被引量：3
3杨东华,李宁宁,王宏志,李建中,高宏.基于任务合并的并行大数据清洗过程优化[J].计算机学报,2016,39(1):97-108. 被引量：47
4沈恩亚.大数据可视化技术及应用[J].科技导报,2020,38(3):68-83. 被引量：24
5王竟俨,侯彦东.基于PyEcharts的第三次农业普查数据可视化分析[J].河南科学,2021,39(4):517-523. 被引量：3
6李相霏,韩珂.基于Flask框架的疫情数据可视化分析[J].计算机时代,2021(12):60-63. 被引量：12

引证文献1

1李泽沁,巩如悦,宋秉键.新冠疫情数据可视化平台的设计与实现[J].现代信息科技,2023,7(9):157-161. 被引量：3

二级引证文献3

1翟莉.基于公务员职位表岗位和专业的可视化分析系统的设计与实现[J].电脑知识与技术,2023,19(22):45-48.
2陈志强,吴海青.一种新型冷链物流监控系统的设计与实现[J].物流科技,2024,47(4):158-160. 被引量：1
3崔晨雨,务宇宽,戴嘉阳,张海东,杨怡.基于B/S模式的项目可视化管理信息系统设计与实现[J].电脑知识与技术,2024,20(16):51-53.

1曹雨梅,刁节文.股权质押、卖空管制对股价崩盘风险的影响研究——基于融资融券制度[J].中国物价,2021(3):74-77.
2郭剑,史耀耀,胡昊,陈振,张军锋,赵盼.基于工业物联网的混流车间机器人自适应调度[J].航空制造技术,2021,64(5):42-51. 被引量：2
3朱逸,尹卫华.网络直播购物情境下的拟剧化营销——基于抖音直播平台的分析与诠释[J].上海对外经贸大学学报,2021,28(2):114-124. 被引量：23
4陈怡倩.伯明翰歌剧院将于2021年夏季上演瓦格纳《莱茵的黄金》[J].歌剧,2020(10):108-109.
5王婷,牟永敏,张志华,崔展齐.JavaScript混淆恶意代码检测方法[J].计算机仿真,2021,38(2):432-437. 被引量：3

延安大学学报（自然科学版）

2021年第2期

浏览历史

内容加载中请稍等...

新冠肺炎疫情信息累积更新采集系统的设计与实现被引量：1

参考文献1

二级参考文献5

共引文献8

同被引文献6

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

新冠肺炎疫情信息累积更新采集系统的设计与实现 被引量：1

参考文献1

二级参考文献5

共引文献8

同被引文献6

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

新冠肺炎疫情信息累积更新采集系统的设计与实现被引量：1