期刊文献+

基于大数据的统计分析模型设计 被引量:6

下载PDF
导出
摘要 统计是利用尽可能少的局部样本数据来发现总体规律,处理对象往往数据规模小且数据结构单一。在大数据环境下,面临海量数据的采集与统计,传统方法已无法满足大规模数据集处理。基于Hadoop系统,利用其分布式存储和并行处理机制,设计了大数据环境下的统计分析模型,从海量数据中提取出有用的信息特征,实现数据资源共享,为相关部门决策提供信息服务。
出处 《软件导刊》 2016年第7期28-30,共3页 Software Guide
基金 山东省统计科研重点项目(KT15217) 2015年山东省高校科技计划资助项目(J15LN15)
  • 相关文献

参考文献7

二级参考文献216

  • 1WHITE T.Hadoop,the definitive guide[M].O'Reilly Media,Inc,2009.
  • 2DEAN J,GHEMAWAT S.MapReduee:simplified data processing on large clusters.[C]//Proc of the 6th Symposium on Operating Systems Design and Implementation.San Francisco:Google Inc,2004.
  • 3Hadoop官方文档:http://hadoop.apache.org/common/docs/r0.18.2/cn/mapred_tutorial.html,2008.
  • 4John Howard,Michael Kazar,Sherri Menees,et al.Scale and performance in a distributed file system[J].ACM Transactions on Computer Systems,1988,6(1).
  • 5Luiz A Barroso,Jeffrey Dean,Urs H¨olzle.Web search for a planet:the Google cluster architecture[J].IEEE Micro,2003,23(2).
  • 6[OL].<http://hadoop.apache.org.>.
  • 7WinterCorp: 2005 TopTen Program Summary. http:// www. wintercorp, com/WhitePapers/WC TopTenWP. pdf.
  • 8TDWI Checklist Report: Big Data Analytics. http://tdwi. org/research/2010/08/Big-Data-Analytics, aspx.
  • 9Chaudhuri S, Dayal U. An overview of data warehousing and OLAP technology. SIGMOD Rec, 1997,26(1): 65-74.
  • 10Madden S, DeWitt D J, Stonebraker M. Database parallelism choices greatly impact scalability. DatabaseColumn Blog. http://www, databasecolumn, com/2007/10/database-parallelism-choices, html.

共引文献2931

同被引文献39

引证文献6

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部