欧美色欧美亚洲另类七区,惠美惠精品网,五月婷婷一区,国产亚洲午夜

課程目錄: R數(shù)據(jù)挖掘技術(shù)-基于R語言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)培訓(xùn)
4401 人關(guān)注
(78637/99817)
課程大綱:

    R數(shù)據(jù)挖掘技術(shù)-基于R語言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)培訓(xùn)

 

 

 

第一講數(shù)據(jù)挖掘和R簡介

1.1 數(shù)據(jù)挖掘

1.2 R語言

1.3 Iris數(shù)據(jù)集

1.4Bodyfat數(shù)據(jù)集

第二講數(shù)據(jù)的導(dǎo)入與導(dǎo)出

2.1 R數(shù)據(jù)的保存與加載

2.2 CSV文件的導(dǎo)入與導(dǎo)出

2.3 通過0DBC從數(shù)據(jù)庫中讀取數(shù)據(jù)

2.4 從Excel中導(dǎo)入與導(dǎo)出數(shù)據(jù)

第三講數(shù)據(jù)可視化展現(xiàn)

3.1 查看數(shù)據(jù)

3.2 單個變量展現(xiàn)

3.3 多個變量展現(xiàn)

3.4 更多探索

3.5 將圖表保存到文件中

第四講決策樹與隨機(jī)森林

4.1 使用party包構(gòu)建決策樹

4.2 使用rpart包構(gòu)建決策樹

4.3 隨機(jī)森林

第五講回歸分析

5.1 線性回歸

5.2 邏輯回歸

5.3 廣義線性回歸

5.4 非線性回歸

第六講聚類分析

6.1 k-means聚類

6.2 k-medoids聚類

6.3 層次聚類

6.4 基于密度的聚類

第七講離群點(diǎn)檢測

7.1 單變量的離群點(diǎn)檢測

7.2 局部離群點(diǎn)因子檢測

7.3 用聚類方法進(jìn)行離群點(diǎn)檢測

7.4 時(shí)間序列數(shù)據(jù)的離群點(diǎn)檢測

第八講時(shí)間序列分析

8.1 R中的時(shí)間序列數(shù)據(jù)

8.2 時(shí)間序列分解

8.3 時(shí)間序列預(yù)測

8.4 時(shí)間序列聚類

8.5 時(shí)間序列分類

第九講關(guān)聯(lián)規(guī)則

9.1 關(guān)聯(lián)規(guī)則的基本概念

9.2 Titanic數(shù)據(jù)集

9.3 關(guān)聯(lián)規(guī)則挖掘

9.4 冗余

9.5 解釋規(guī)則

9.6 關(guān)聯(lián)規(guī)則的可視化

第十講社交網(wǎng)絡(luò)分析

10.1 詞項(xiàng)網(wǎng)絡(luò)

10.2 推文網(wǎng)絡(luò)

10.3 雙模式網(wǎng)絡(luò)

第十一講 R與Hadoop/Spark等大數(shù)據(jù)技術(shù)的融合

1)R/Hadoop數(shù)據(jù)處理技術(shù)介紹

2)SparkR數(shù)據(jù)處理技術(shù)介紹

3)基于Hadoop/Yarn集群的應(yīng)用展望

六、培訓(xùn)

1,了解R語言數(shù)據(jù)挖掘的相關(guān)知識。

2,學(xué)習(xí)R的數(shù)據(jù)挖掘核心技術(shù)方法以及應(yīng)用特征。

3,深入使用R在數(shù)據(jù)挖掘和分析中的使用。

4,了解R與Hadoop、Spark等技術(shù)的融合使用。

主站蜘蛛池模板: 怀远县| 安岳县| 蒲城县| 平安县| 冀州市| 清河县| 沙洋县| 乌鲁木齐市| 江都市| 怀来县| 建平县| 都安| 浦北县| 淮北市| 南川市| 安阳县| 固镇县| 大渡口区| 上蔡县| 子洲县| 平乡县| 锡林郭勒盟| 清流县| 绥德县| 通海县| 新兴县| 如东县| 长乐市| 五峰| 海丰县| 钟祥市| 巴楚县| 额敏县| 娄底市| 神池县| 碌曲县| 衡阳市| 龙泉市| 竹北市| 泽库县| 镇平县|