-
题名Python爬虫技术在信息流行病学中的应用
被引量:15
- 1
-
-
作者
周江杰
王胜锋
李立明
-
机构
北京大学公共卫生学院流行病与卫生统计学系
-
出处
《中华流行病学杂志》
CAS
CSCD
北大核心
2020年第6期952-956,共5页
-
文摘
Python网络爬虫技术是一种通过模拟用户的网络浏览行为以实现从网络中自动、大量提取信息的技术,是信息流行病学研究收集并整合多源异构信息数据的关键基础。Python网络爬虫可分为简单爬虫与大型爬虫,集数据采集与数据库构建于一体,语法简洁、灵活性高、学习成本低、维护成本低。它适用于信息流行病学的各种应用场景,通过对互联网中健康相关信息的分析,实现多种公共卫生监测、健康干预实施及效果评价、智慧寻医方略优化等目标。近年,我国政府开始鼓励对含互联网信息在内的多源大数据的整合利用,在此背景下,Python爬虫技术的应用场景势必会越来越多,相应的人才培养、技术革新建议纳入到公共卫生教育和科研体系之中。
-
关键词
Python爬虫技术
信息流行病学
公共卫生监测
健康干预
智慧寻医
-
Keywords
Python web crawler technology
Infodemiology
Public health surveillance
Health intervention
Smart doctor seeking
-
分类号
R181.3
[医药卫生—流行病学]
TP312.1
[自动化与计算机技术—计算机软件与理论]
-