
數(shù)據(jù)挖掘和數(shù)據(jù)統(tǒng)計分析技術(shù)—基于Python和R培訓
第一講 數(shù)據(jù)挖掘,Python和R簡介
1.1數(shù)據(jù)挖掘
1.2Python語言
1.3 R語言
1.4 Iris數(shù)據(jù)集
1.5 Bodyfat數(shù)據(jù)集
第二講 數(shù)據(jù)的導入與導出
2.1 R數(shù)據(jù)的保存與加載
2.2 CSV文件的導入與導出
2.3 通過ODBC從數(shù)據(jù)庫中讀取數(shù)據(jù)
2.4 從Excel中導入與導出數(shù)據(jù)
2.5 Python的數(shù)據(jù)操作
第三講 數(shù)據(jù)可視化展現(xiàn)
3.1 查看數(shù)據(jù)
3.2 單個變量展現(xiàn)
3.3 多個變量展現(xiàn)
3.4 更多探索
3.5 將圖表保存到文件中
第四講 決策樹與隨機森林
4.1 使用party包構(gòu)建決策樹
4.2 使用rpart包構(gòu)建決策樹
4.3 隨機森林
4.4 Python中的決策樹實現(xiàn)
4.5 Python決策樹實例
第五講 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
5.5 Python中的回歸實現(xiàn)
5.6 Python回歸實例
第六講 聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
6.5 Python中的聚類實現(xiàn)
6.6 Python聚類實例
第七講 離群點檢測
7.1單變量的離群點檢測
7.2局部離群點因子檢測
7.3用聚類方法進行離群點檢測
7.4時間序列數(shù)據(jù)的離群點檢測
7.5 Python中的孤立點實例
第八講 時間序列分析
8.1 R中的時間序列數(shù)據(jù)
8.2 時間序列分解
8.3 時間序列預測
8.4 時間序列聚類
8.5 時間序列分類
8.6 Python中的時間序列實例
第九講 關聯(lián)規(guī)則
9.1 關聯(lián)規(guī)則的基本概念
9.2 Titanic數(shù)據(jù)集
9.3 關聯(lián)規(guī)則挖掘
9.4 消除冗余
9.5 解釋規(guī)則
9.6 關聯(lián)規(guī)則的可視化
9.7 Python中的關聯(lián)規(guī)則實例
第十講 社交網(wǎng)絡分析
10.1 詞項網(wǎng)絡
10.2 推文網(wǎng)絡
10.3 雙模式網(wǎng)絡
10.4 Python中的社交網(wǎng)絡分析實例