期刊文献+

基于Docker搭建Spark大数据集群数据挖掘平台 被引量:3

下载PDF
导出
摘要 搭建大数据集群采用虚拟机部署的传统方法存在效率低、搭建步骤繁琐、时间成本高等问题,无法满足应用需求。随着虚拟化技术的发展,Docker技术由于具有占用资源小、启动速度快、部署快捷等优势,Docker技术能有效解决传统方法存在的问题,使得应用场景非常丰富。为此,提出基于Docker技术搭建Spark大数据集群实现数据挖掘平台。首先,介绍Docker技术的特点,通过与虚拟机技术对比阐述Docker技术的优势,并且介绍Spark集群架构和Kubernetes技术;然后,详细分析数据挖掘平台的搭建步骤,测试Docker技术和虚拟机技术的程序运行速度,测试表明Docker技术具有较短的运行时间,效率更高。为了Spark集群数据挖掘平台在节点扩展和管理更加灵活,提出基于Kubernetes技术改进原来集群,使得新增节点和管理集群更加高效。
作者 蔡全福 CAI Quanfu
出处 《信息技术与信息化》 2022年第9期70-73,共4页 Information Technology and Informatization
基金 2020年福建省中青年教师教育科研项目(JAT201344)。
  • 相关文献

参考文献5

二级参考文献29

  • 1董新华,李瑞轩,周湾湾,王聪,薛正元,廖东杰.Hadoop系统性能优化与功能增强综述[J].计算机研究与发展,2013,50(S2):1-15. 被引量:70
  • 2Dua,Bangalore,Raja.Virtualization vs Containerization to Support Paa S. . 2014
  • 3杨保华,戴王剑,曹亚仑.Docker技术入门与实战[M].北京:机械工业出版社,2014.
  • 4肖德时.深入浅出 Docker[EB/OL]. [2015-01-05]. ht- tp ://www. infoq, com/cn/articles/docker-core-technology- preview? utm_source = infoq&utm_medium = related_content_ link&utm campaign = relatedContent_articles_clk.
  • 5Compton D. Why Docker and CoreOS' split was predictable [ EB/OL ]. [ 2015 - 01 - 05 ]. http://danielcompton, net/ 2014/12/02/modular-integrated-docker-coreos.
  • 6Lowy G. Application performance management enables De- vOps ROI[ EB/OL]. [2015-01-05 ]. http://www, apmdi- gest. com/application - performance - mangent - apm - devops - rol.
  • 7Garber L. News briefs[ J]. IEEE Security and Privacy ,2011,9 (6) :9-11.
  • 8Swan C. Docker: present and future [ EB/OL]. [ 2015 -01 - 05 ]. http ://www. infoq, com articles/docker-future.
  • 9Kavis M. Blurring the line between PaaS and laaS[ EB/OL]. [2015-01-05 ]. http://www, forbes, com/sites/mikekavis/ 2014/06/02/blurring-the -line - between-paas-and-iaas/.
  • 10Shalom N. Do I need OpenStack if I use Docker[ EB/OL]. [ 2015-01-05 ]. http ://pensource. com/business/14/11/do- i-need-openstack-if-i-use-docker.

共引文献312

同被引文献19

引证文献3

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部