摘要
大数据(big data)是指由于容量太大和过于复杂,无法在一定时间内用常规软件对其内容进行抓取、管理、存储、检索、共享、传输和分析的数据集。大数据具有“4V”特征:①数据容量(Volume)大,常常在 PB(1 PB=250 B)级以上;②数据种类(Variety)多,常常具有不同的数据类型(结构化、半结构化和非结构化)和数据来源;③产生和更新速度(Velocity)快(如实时数据流),时效性要求高;④科学价值(Value)大,尽管利用密度低,却常常蕴藏着新知识或具有重要预测价值[1]。人类已进入大数据时代。国际数据公司的研究结果表明,2011年全球产生的数据量高达1.82 ZB[2]。2012年5月,联合国发布了《大数据与人类发展:挑战与机遇》白皮书,指出大数据是一个历史性机遇,人们可以使用极为丰富的数据资源对社会经济进行前所未有的实时分析,帮助政府更好地响应社会和经济运行[3]。
出处
《中华流行病学杂志》
CAS
CSCD
北大核心
2014年第6期617-620,共4页
Chinese Journal of Epidemiology
关键词
生物医学
大数据
个体化医学
Biomedicine
Big data
Personalized medicine