班級(jí)規(guī)模及環(huán)境--熱線:4008699035 手機(jī):15921673576( 微信同號(hào)) |
每期人數(shù)限3到5人。 |
上課時(shí)間和地點(diǎn) |
上課地點(diǎn):【上海】:同濟(jì)大學(xué)(滬西)/新城金郡商務(wù)樓(11號(hào)線白銀路站) 【深圳分部】:電影大廈(地鐵一號(hào)線大劇院站)/深圳大學(xué)成教院 【北京分部】:北京中山學(xué)院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領(lǐng)館區(qū)1號(hào)(中和大道) 【沈陽分部】:沈陽理工大學(xué)/六宅臻品 【鄭州分部】:鄭州大學(xué)/錦華大廈 【石家莊分部】:河北科技大學(xué)/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協(xié)同大廈
最近開課時(shí)間(周末班/連續(xù)班/晚班):2020年3月16日 |
實(shí)驗(yàn)設(shè)備 |
◆課時(shí): 共5 部份,30學(xué)時(shí)
☆注重質(zhì)量
☆邊講邊練
☆合格學(xué)員免費(fèi)推薦工作
★實(shí)驗(yàn)設(shè)備請(qǐng)點(diǎn)擊這兒查看★ |
質(zhì)量保障 |
1、培訓(xùn)過程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在以后培訓(xùn)班中重聽;
2、培訓(xùn)結(jié)束后,授課老師留給學(xué)員聯(lián)系方式,保障培訓(xùn)效果,免費(fèi)提供課后技術(shù)支持。
3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會(huì)。 |
大綱 |
|
1) Spark Streaming:數(shù)據(jù)源和DStream2) 無狀態(tài)transformation與有狀態(tài)transformation3) Streaming Window的操作4) sparksql 編程實(shí)戰(zhàn)5) spark的多語言操作6) spark新版本的新特性
Spark MLlib
機(jī)器學(xué)習(xí) 前面課程大家已經(jīng)掌握第一代機(jī)器學(xué)習(xí)工具R,而后又學(xué)習(xí)了第二代機(jī)器學(xué)習(xí)工具M(jìn)ahout,這里大家將會(huì)學(xué)習(xí)第三代機(jī)器學(xué)習(xí)工具M(jìn)Llib,大家不僅將會(huì)了解MLlib的組件及其調(diào)用,而且會(huì)通過Spark的項(xiàng)目深入了解MLlib的現(xiàn)實(shí)使用。通過此部分大家也可以看出課程不僅著眼于現(xiàn)在,更是著眼于大家的未來在行業(yè)中的發(fā)展。
1) 介紹
a) Spark MLlib組件介紹 b) 基本數(shù)據(jù)類型
2) 回歸算法
c) 廣義線性模型 d) 邏輯回歸
3) 分類算法
e) 樸素貝葉斯 f) 決策樹 g) 隨機(jī)森林
4) 第四章 推薦系統(tǒng)
5) 第五章 聚類
h) Kmeans i) Sparse kmeans j) Kmeans++ k) Kmeans II
l) Streaming kmeans m) Gaussian Mixture Model
Spark GraphX
圖計(jì)算
a) 二分圖b) 概述c) 構(gòu)造圖d) 屬性圖e) PageRank
項(xiàng)目實(shí)戰(zhàn)
智慧城市大數(shù)據(jù)分析項(xiàng)目
城市中每時(shí)每刻都會(huì)產(chǎn)生海量數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和可視化技術(shù),分析出的數(shù)據(jù)可以改進(jìn)城市規(guī)劃,緩解交通擁堵,抓捕罪犯。項(xiàng)目會(huì)使用真實(shí)的數(shù)據(jù)。 涉及到所學(xué)知識(shí)如下:
項(xiàng)目技術(shù)架構(gòu)體系:
a) 實(shí)時(shí)流處理 Kafka,Spark Streaming b) 分布式運(yùn)算 Hadoop,Spark c) 數(shù)據(jù)庫 Hbase,Redis d) 機(jī)器學(xué)習(xí) Spark Mllib e) 前臺(tái)web展示數(shù)據(jù) Struts2,echart
手機(jī)軟件推薦系統(tǒng)項(xiàng)目
使用數(shù)據(jù)來自某互聯(lián)網(wǎng)平臺(tái)手機(jī)助手,項(xiàng)目目標(biāo)通過機(jī)器學(xué)習(xí)所學(xué)知識(shí)挖掘平臺(tái)手機(jī)用戶喜好,給用戶準(zhǔn)確推薦手機(jī)軟件,類似360手機(jī)助手、華為手機(jī)助手、百度手機(jī)助手推薦功能。
項(xiàng)目技術(shù)架構(gòu)體系:
a) 分布式平臺(tái) Hadoop,Spark
b) 數(shù)據(jù)清洗 Hivec) 數(shù)據(jù)分析 R RStudiod) 推薦服務(wù) Dubboxe) 規(guī)則過濾 Droolsf) 機(jī)器學(xué)習(xí) MLlib
網(wǎng)絡(luò)流量異常檢測項(xiàng)目
項(xiàng)目目標(biāo)通過機(jī)器學(xué)習(xí)所學(xué)知識(shí)檢測出異常,包括檢測欺詐,網(wǎng)絡(luò)攻擊,服務(wù)器傳感器故障燈(本項(xiàng)目用戶現(xiàn)在熱門的電商網(wǎng)站的流量分析檢測,比如京東,天貓,淘寶等)。項(xiàng)目功能應(yīng)用于各大互聯(lián)網(wǎng)平臺(tái)中,各大互聯(lián)網(wǎng)平臺(tái)均需要網(wǎng)絡(luò)安全予以重視和預(yù)防以及檢測。
項(xiàng)目技術(shù)架構(gòu)體系:
a) 數(shù)據(jù)存儲(chǔ) Hadoop b) 數(shù)據(jù)準(zhǔn)備 Spark c) 數(shù)據(jù)分析 R RStudio d) 機(jī)器學(xué)習(xí) MLlib e) 數(shù)據(jù)評(píng)價(jià)及調(diào)參
|