第一部份:某企業(yè)級大數(shù)據(jù)應用服務架構演進
1)大數(shù)據(jù)在企業(yè)中的主要應用
2)業(yè)務快速迭代背景下對技術的挑戰(zhàn)
3)企業(yè)級大數(shù)據(jù)應用服務整體介紹
第二部份:大數(shù)據(jù)服務高可用設計原則
1)多維度切入高可用架構設計理念
2)可用性評價維度介紹
3)資源隔離保護核心服務
4)流量控制打造柔性可用系統(tǒng)
5)分鐘級定位故障以及糾錯方案
6)兜底以及回滾、降級減少故障恢復時間
7)常態(tài)化的故障演練機制以及容災方案
第三部份:基于MySQL集群構建可伸縮性存儲層
1)數(shù)據(jù)量以及請求量對查詢服務的沖擊
2)可伸縮的應對上下游壓力的實踐
3)讀寫分離下MySQL的高可用設計
第四部份:基于HBase的支撐百億級別數(shù)據(jù)查詢(1)
1)hbase入門
2)hbase簡單操作
3)hbase架構詳解(what and why)
第五部份:基于hbase的支撐百億級別數(shù)據(jù)查詢(2)
1)hbase核心源碼深度剖析
2)hbase優(yōu)劣勢以及技術選型
3)hbase企業(yè)級典型應用場景以及較佳實踐
第六部份:企業(yè)級大數(shù)據(jù)OLAP介紹
1)OLAP是什么以及常見操作
2)OLAP引擎技術方案選型
第七部份:Kylin離線大數(shù)據(jù)OLAP引擎解決方案
1)Kylin介紹
2)海量數(shù)據(jù)較精確去重的實現(xiàn)
3)Kylin的優(yōu)勢以及局限
4)Apache Kylin的應用場景和較佳實踐
第八部份:Druid實時大數(shù)據(jù)分析引擎
1)Druid介紹
2)Druid原理深度剖析
3)Druid應用場景和較佳實踐
第九部份:大數(shù)據(jù)查詢服務 統(tǒng)一SQL引擎層
1)為什么需要SQL接口層
2)SQL接口層的技術方案選型
3)基于apache calcite實現(xiàn)標準SQL查詢
第十部份:深度挖掘企業(yè)大數(shù)據(jù)價值
1)企業(yè)大數(shù)據(jù)指標體系以及管理策略
2)我們需要收集哪些數(shù)據(jù)
3)企業(yè)大數(shù)據(jù)應用的痛點
4)討論一下機器學習的問題域
5)算法工程師們都在做些什么
第十一部份:機器學習算法入門
1)機器學習入門 — 什么是機器學習
2)線性回歸算法由淺入深— 麻雀雖小、五臟俱全
3)手把手完成線性擬合數(shù)據(jù)集實戰(zhàn)
第十二部份:用戶畫像應用介紹
1)比你更了解你,淺談用戶畫像
2)用戶畫像與個性化推薦系統(tǒng)領域
3)用戶畫像效果實時在線評估策略
第十三部份:競價廣告系統(tǒng)點擊率預測算法與實戰(zhàn)
1)線性模型logistic回歸算法介紹
2)基于線性模型logistic回歸的點擊率預測實戰(zhàn)
3)非線性模型GBDT算法介紹
4)非線性模型GBDT與推薦排序
5)基于AUC值、ROC曲線的模型評價方法 |