
機器學習與R語言培訓
一:機器學習基本理論
機器學習概述
機器學習算法分類及知識框架
機器學習相關(guān)概念
機器學習一般步驟
案例:用R實現(xiàn)機器學習模型預測
二:R語法基礎(chǔ)
R語言基礎(chǔ)語法
數(shù)據(jù)處理常用R包介紹(tidyr,dplyr,stringr,reshape2,ggplot2)
數(shù)據(jù)的存取與編輯
非結(jié)構(gòu)化數(shù)據(jù)的讀取
案例:用R實現(xiàn)MySQL數(shù)據(jù)庫數(shù)據(jù)讀取
三:數(shù)據(jù)清洗方法
缺失數(shù)據(jù)處理
異常值的辨識處理
不平衡數(shù)據(jù)的處理
特征提取與特征工程
案例:針對美國人群收入等數(shù)據(jù)進行數(shù)據(jù)清洗
四:線性回歸與Logistic回歸
線性回歸與小二乘法
Lasso回歸及嶺回歸
Logistic回歸模型
多分類Logistic回歸模型
案例:運用Logistic回歸模型預測學生錄取情況
五:K近鄰(KNN)算法
k近鄰算法原理
k近鄰算法R實現(xiàn)
案例:運用KNN實現(xiàn)前列腺癌癥檢測
六:聚類算法
聚類算法原理
聚類算法R實現(xiàn)
案例:運用聚類分析進行離群點識別
七:基于決策樹類型算法介紹
決策樹算法
隨機森林算法
八:提升算法
Adaboost算法
GBDT算法
XGBoost
案例:針對美國人群收入預測模型比較
九:SVM支持向量機算法介紹
SVM基本原理
SVM算法的R實現(xiàn)
十:人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(RNN)
深度學習
案例:運用神經(jīng)網(wǎng)絡(luò)實現(xiàn)手寫數(shù)字識別
十一:地圖可視化:上海交通地圖數(shù)據(jù)可視化實戰(zhàn)
數(shù)據(jù)可視化基本圖形選擇匯總
繪制數(shù)據(jù)地圖常用方法
交互式可視化實戰(zhàn)
十二:機器學習mlr包:債務(wù)預測實戰(zhàn)
mlr包介紹
實際問題分析及數(shù)據(jù)處理
多種分類算法模型的比較