1、培訓過程中,如有部分內(nèi)容理解不透或消化不好,可免費在以后培訓班中重聽; 2、培訓結束后,授課老師留給學員聯(lián)系方式,保障培訓效果,免費提供課后技術支持。 3、培訓合格學員可享受免費推薦就業(yè)機會。☆合格學員免費頒發(fā)相關工程師等資格證書,提升職業(yè)資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。 |
Gym是為測試和開發(fā)RL算法而設計的環(huán)境/任務的集合。它讓用戶不必再創(chuàng)建復雜的環(huán)境。Gym用Python編寫,它有很多的環(huán)境,比如機器人模擬或Atari 游戲。它還提供了一個在線排行榜,供人們比較結果和代碼。
第1章 強化學習與常用的仿真環(huán)境平臺介紹(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2等)
第2章 OpenAI gym中的常用仿真環(huán)境介紹,包括Atari 2600 游戲系列、MuJoCo 物理模擬器、Toy text 文本環(huán)境、Robotics機械手與機械臂模擬器等
第3章 馬爾科夫決策過程MDP
第4章 基于gym的MDP實例講解,基于OpenAI Gym構建股票市場交易環(huán)境
第5章 基于gym的強化學習實踐:基于值函數(shù)的強化學習方法實現(xiàn);基于策略梯度的強化學習方法實現(xiàn)
第6章 虛擬環(huán)境Universe: 一個用于訓練解決通用問題 AI 的基礎架構
第7章 基于Universe的強化學習實踐:用OpenAI公司的Gym工具庫和Universe平臺為游戲創(chuàng)建人工智能機器人 |