Hadoop学习
Hadoop2.0架构图

| 未涉及组件 |
简要介绍 |
| Storm |
分布式流式处理、实时计算系统 |
| Kafka |
linkedin用于日志处理的分布式消息队列 |
| Mathout |
数据挖掘算法库 |
-
HDFS:分布式存储系统
-
MapReduce:分布式离线计算框架
-
Yarn:资源调度和管理平台

-
Zookeeper:分布式协调服务
-
Hive:数据仓库
-
Hbase:分布式存储系统、数据库
-
Kafka:流式数据处理——消息队列
-
Storm:流式数据处理——计算框架
-
Flume:流式数据处理——数据采集
-
Spark:内存计算框架