摘要
统计是利用尽可能少的局部样本数据来发现总体规律,处理对象往往数据规模小且数据结构单一。在大数据环境下,面临海量数据的采集与统计,传统方法已无法满足大规模数据集处理。基于Hadoop系统,利用其分布式存储和并行处理机制,设计了大数据环境下的统计分析模型,从海量数据中提取出有用的信息特征,实现数据资源共享,为相关部门决策提供信息服务。
出处
《软件导刊》
2016年第7期28-30,共3页
Software Guide
基金
山东省统计科研重点项目(KT15217)
2015年山东省高校科技计划资助项目(J15LN15)