什么是hadoop
一、Hadoop入門(mén),了解什么是hadoop
1. Hadoop產(chǎn)生背景
2. Hadoop在大數(shù)據(jù)、云計(jì)算中的位置和關(guān)系
3. 國(guó)內(nèi)外Hadoop應(yīng)用案例介紹
4. 國(guó)內(nèi)Hadoop的就業(yè)情況分析及課程大綱介紹
5. Hadoop生態(tài)圈以及各組成部分的簡(jiǎn)介
6. Hadoop核心MapReduce簡(jiǎn)單例子說(shuō)明
二、分布式文件系統(tǒng)HDFS,是數(shù)據(jù)庫(kù)管理員的基礎(chǔ)課程
1. 分布式文件系統(tǒng)DFS簡(jiǎn)介
2. HDFS的系統(tǒng)組成介紹
3. HDFS的組成部分詳解
4. 副本存放策略及路由規(guī)則
5. 命令行接口
6. Java接口
7. 客戶端與HDFS的數(shù)據(jù)流講解
8. HDFS的可用性(HA)
三、初級(jí)MapReduce,成為Hadoop開(kāi)發(fā)人員的基礎(chǔ)課程
1. 如何理解map、reduce計(jì)算模型
2. 剖析偽分布式下MapReduce作業(yè)的執(zhí)行過(guò)程
3. 序列化
4. MapReduce的類型與格式
5. MapReduce開(kāi)發(fā)環(huán)境搭建
6. MapReduce應(yīng)用開(kāi)發(fā)
7. 更多示例講解,熟悉MapReduce算法原理
四、高級(jí)MapReduce,高級(jí)Hadoop開(kāi)發(fā)人員的關(guān)鍵課程
1. 使用壓縮分隔減少輸入規(guī)模
2. 利用Combiner減少中間數(shù)據(jù)
3. 編寫(xiě)Partitioner優(yōu)化負(fù)載均衡
4. MapReduce優(yōu)化
5. 編程實(shí)戰(zhàn)
五、Hadoop集群與管理,是數(shù)據(jù)庫(kù)管理員的高級(jí)課程
1. Hadoop集群的搭建
2. Hadoop集群的監(jiān)控
3. Hadoop集群的管理
4. 集群下運(yùn)行MapReduce程序
六、HBase基礎(chǔ)知識(shí),面向列的實(shí)時(shí)分布式數(shù)據(jù)庫(kù)
1. HBase定義
2. HBase與RDBMS的對(duì)比
3. 數(shù)據(jù)模型
4. 系統(tǒng)架構(gòu)
5. HBase上的MapReduce
6. 表的設(shè)計(jì)
七、HBase集群及其管理
1. 集群的搭建過(guò)程講解
2. 集群的監(jiān)控
3. 集群的管理
八、HBase客戶端
1. HBase Shell以及演示
2. Java客戶端以及代碼演示
九、Hive
1. 數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí)
2. Hive定義
3. Hive體系結(jié)構(gòu)簡(jiǎn)介
4. Hive集群
5. 客戶端簡(jiǎn)介
十、HiveQL
1. HiveQL定義
2. HiveQL與SQL的比較
3. 數(shù)據(jù)類型
4. 表與表分區(qū)概念
5. 表的操作與CLI客戶端演示
6. 數(shù)據(jù)導(dǎo)入與CLI客戶端演示
7. 查詢數(shù)據(jù)與CLI客戶端演示
8. 數(shù)據(jù)的連接與CLI客戶端演示
9. 用戶自定義函數(shù)(UDF)的開(kāi)發(fā)與演





