AM
分布式解決方案介紹
Hadoop Ecosystem與實際應用案例
- 分布式存儲系統(tǒng):HDFS
- 分布式計算系統(tǒng):MapReduce
- 海量數(shù)據(jù)分析系統(tǒng):Hive
- 分布式協(xié)調系統(tǒng):Zookeeper
- 分布式實時讀寫數(shù)據(jù)存儲系統(tǒng):HBase
- 工作流調度系統(tǒng):Ooize
NoSQL與實際應用案例
- NoSQL與SQL的關系
- NoSQL適合的場景
- 面向列的存儲:Cassandra
- 文檔數(shù)據(jù)庫:MongoDB
- 優(yōu)點
- 不足
- 圖數(shù)據(jù)庫:Neo4j
PM
海量數(shù)據(jù)分析技術-MAPREDUCE
Map Reduce編程詳解
- map函數(shù)
- reduce函數(shù)
- 排序與分區(qū)
跨語言MR框架:Streaming
- 原理
- 實際應用
Hadoop文件壓縮
- gzip
- bz2
- lzo
Hadoop文件格式
- TextFile
- SequenceFile
- RCFile
輸入格式
- TextInputFormat
- SequenceFileInputFormat
- RCFileInputFormat
輸出格式
- TextOutputFormat
- SequenceFileOutputFormat
- RCFileOutputFormat
- MultipleOutputs
海里網(wǎng)站日志分析系統(tǒng)示例
- 網(wǎng)站日志介紹
- 業(yè)務分析
- 系統(tǒng)實現(xiàn)
AM
Hadoop的架設與維護
生產環(huán)境部署
參數(shù)配置
運維操作
監(jiān)控策略
PM
Cassandra的原理與實際應用
數(shù)據(jù)模型
編程接口
- 一致性模型與數(shù)據(jù)容錯
- CAP
- ReadRepair
- Hint
- AntiPoint
底層文件存儲格式
與Map Reduce的整合
實際應用案例
HBase
數(shù)據(jù)模型
編程接口
底層文件格式
集群管理
數(shù)據(jù)容錯
與Map Reduce的整合
|