-
题名浅析Hadoop 1.0与2.0设计原理
被引量:8
- 1
-
-
作者
尧炜
马又良
-
机构
中讯邮电咨询设计院有限公司
-
出处
《邮电设计技术》
2014年第7期37-42,共6页
-
文摘
简要介绍了Hadoop发展历史及其版本演进进程;详细阐述了Hadoop 1.0中的HDFS设计理念、架构、读取/写入数据流程和MapReduce架构、任务执行流程,以及Hadoop 1.0功能不足问题;详细阐述了针对Hadoop 1.0功能不足问题,Hadoop 2.0所做的增强功能应对方案,包括NameNode HA方案、HDFS Federation方案和YARN设计原理等。
-
关键词
HADOOP
NameNode
HA
HDFS
FEDERATION
YARN
-
Keywords
Hadoop
NameNode HA
HDFS Federation
YARN
-
分类号
TP939
[自动化与计算机技术]
-
-
题名电信运营商DW/BI系统发展探讨
被引量:2
- 2
-
-
作者
尧炜
马又良
-
机构
中讯邮电咨询设计院有限公司
-
出处
《邮电设计技术》
2012年第10期13-16,共4页
-
文摘
随着大数据时代的来临,越来越多的企业认识到数据作为其核心资产所蕴含的价值。数据仓库/商业智能(DW/BI)系统作为数据服务平台,在发挥数据价值上起到了至关重要的作用。国内三大运营商已经开始或者即将开始建设企业级集中化DW/BI系统。据此从数据仓库技术选型、数据标准化实施策略以及提升自主分析能力3个方面对DW/BI系统的发展提出了建议。
-
关键词
大数据
数据仓库
商业智能
云计算
数据标准化
-
Keywords
Big data
Data warehouse
Business intelligence
Cloud computing
Data standardization
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于开源技术的网络数据采集系统设计
- 3
-
-
作者
尧炜
-
机构
中讯邮电咨询设计院有限公司
-
出处
《邮电设计技术》
2015年第12期29-32,共4页
-
文摘
通过分析网络数据采集的特点,提出了网络数据采集系统的设计目标,即支持关键网络指标实时计算和查询、支持多数据源和多消费者、支持实时采集和批量采集且具备线性扩展能力。采用Flume、Kafka、Storm、Hadoop等开源技术完成了系统架构设计。对架构实施可能面临的挑战提出了应对策略。
-
关键词
FLUME
Kafka
网络数据
实时采集
批量采集
-
Keywords
Flume
Kafka
Network data
Real-time collection
Batch collection
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-