欧美色欧美亚洲另类七区,惠美惠精品网,五月婷婷一区,国产亚洲午夜

課程目錄:GPU高性能計(jì)算培訓(xùn)
4401 人關(guān)注
(78637/99817)
課程大綱:

          GPU高性能計(jì)算培訓(xùn)

 

 

 

GPU離性能計(jì)算一
OpenACC編程基礎(chǔ)
與優(yōu)化進(jìn)階

1. OpenACC基礎(chǔ):概念、與CUDA區(qū)別、編譯器、生態(tài);共享存儲(chǔ)結(jié)
2.0penACC開(kāi)發(fā)環(huán)境搭建配置

3.0penACC四步開(kāi)發(fā)流程:判斷并行性、并行化表達(dá)、顯式數(shù)據(jù)傳遂、優(yōu)化

?判斷并行性:Profile工具pgprof

?并行化表達(dá):引導(dǎo)關(guān)鍵字Kernerls和Parallel Loop

?顯式管理數(shù)據(jù)的拷貝:引導(dǎo)關(guān)鍵字Data

?優(yōu)化:統(tǒng)一內(nèi)存管理、線(xiàn)程并行層級(jí)、collapse、tile

OpenACC上機(jī)實(shí)操

? Hellow world ?矢量點(diǎn)乘

GPU高性能計(jì)S—
CUDA編程基礎(chǔ)
與優(yōu)化進(jìn)階

1. CUDA基礎(chǔ):API、數(shù)據(jù)并行、線(xiàn)程模型、存儲(chǔ)播型、控制、同步、并發(fā)和通信、加
速比

2. CUDA幵發(fā)環(huán)境搭建和工具配置

3. CUDA優(yōu)化進(jìn)階:線(xiàn)程組織調(diào)度、分支語(yǔ)句、訪存優(yōu)化、數(shù)據(jù)傳輸、原子操作

4. GPU并行計(jì)算模式及案例分析

分析調(diào)試:parallel nsight、visual profiler、cuda-gdb

5. CUDA生態(tài)系統(tǒng)和相關(guān)專(zhuān)業(yè)領(lǐng)域軟件介紹

GPU高性能計(jì)算一
深度學(xué)習(xí)

1.深度學(xué)習(xí)GPU解決方案:

? 基于GPU的交互式深度學(xué)習(xí)訓(xùn)練平臺(tái):DIGITS
? 深度學(xué)習(xí)框架的GPU加速:TensorFlow、Caffe等
? NVIDIA深度學(xué)習(xí) SDK:cuDNN, TensorRT, NCCL, CUDA-X
? 深度學(xué)習(xí)顯卡選擇

主站蜘蛛池模板: 南康市| 巴林右旗| 罗江县| 新兴县| 达日县| 侯马市| 印江| 遵化市| 天峻县| 义马市| 麻江县| 安顺市| 眉山市| 怀柔区| 阿尔山市| 介休市| 黑山县| 乡城县| 徐闻县| 岳普湖县| 香河县| 筠连县| 宜黄县| 桓台县| 柳林县| 盐城市| 修文县| 汉寿县| 龙陵县| 霍山县| 绥芬河市| 临猗县| 承德县| 萨嘎县| 莆田市| 漳浦县| 武功县| 丁青县| 枣强县| 新宁县| 萨迦县|