階段三:Hadoop離線計算
學(xué)習(xí)內(nèi)容:?
Hadoop生態(tài)環(huán)境介紹、Hadoop云計算中的位置和關(guān)系、國內(nèi)外Hadoop應(yīng)用案例介紹、Hadoop 概念、版本、歷史、Hadoop 核心組成介紹及hdfs、mapreduce 體系結(jié)構(gòu)、Hadoop 的集群結(jié)構(gòu)、Hadoop 偽分布的詳細(xì)安裝步驟、通過命令行和瀏覽器觀察hadoop、HDFS底層工作原理、HDFS datanode、namenode詳解、Hdfs shell、Hdfs java api 、Mapreduce四個階段介紹、Writable、InputSplit和OutputSplit、Maptask、Shuffle:Sort,Partitioner,Group,Combiner、Reducer......
學(xué)習(xí)目標(biāo):?
此部分帶領(lǐng)大家了解hadoop的用途,在大數(shù)據(jù)中的用途,以及快速搭建一個hadoop的實驗環(huán)境,在本過程中不僅將用到前面的Linux知識,而且會對hadoop的架構(gòu)有深入的理解,并為你以后架構(gòu)大數(shù)據(jù)項目打下堅實基礎(chǔ)。