
GPU高性能計(jì)算培訓(xùn)
GPU離性能計(jì)算一
OpenACC編程基礎(chǔ)
與優(yōu)化進(jìn)階
1. OpenACC基礎(chǔ):概念、與CUDA區(qū)別、編譯器、生態(tài);共享存儲(chǔ)結(jié)
2.0penACC開(kāi)發(fā)環(huán)境搭建配置
3.0penACC四步開(kāi)發(fā)流程:判斷并行性、并行化表達(dá)、顯式數(shù)據(jù)傳遂、優(yōu)化
?判斷并行性:Profile工具pgprof
?并行化表達(dá):引導(dǎo)關(guān)鍵字Kernerls和Parallel Loop
?顯式管理數(shù)據(jù)的拷貝:引導(dǎo)關(guān)鍵字Data
?優(yōu)化:統(tǒng)一內(nèi)存管理、線(xiàn)程并行層級(jí)、collapse、tile
OpenACC上機(jī)實(shí)操
? Hellow world ?矢量點(diǎn)乘
GPU高性能計(jì)S—
CUDA編程基礎(chǔ)
與優(yōu)化進(jìn)階
1. CUDA基礎(chǔ):API、數(shù)據(jù)并行、線(xiàn)程模型、存儲(chǔ)播型、控制、同步、并發(fā)和通信、加
速比
2. CUDA幵發(fā)環(huán)境搭建和工具配置
3. CUDA優(yōu)化進(jìn)階:線(xiàn)程組織調(diào)度、分支語(yǔ)句、訪存優(yōu)化、數(shù)據(jù)傳輸、原子操作
4. GPU并行計(jì)算模式及案例分析
分析調(diào)試:parallel nsight、visual profiler、cuda-gdb
5. CUDA生態(tài)系統(tǒng)和相關(guān)專(zhuān)業(yè)領(lǐng)域軟件介紹
GPU高性能計(jì)算一
深度學(xué)習(xí)
1.深度學(xué)習(xí)GPU解決方案:
? 基于GPU的交互式深度學(xué)習(xí)訓(xùn)練平臺(tái):DIGITS
? 深度學(xué)習(xí)框架的GPU加速:TensorFlow、Caffe等
? NVIDIA深度學(xué)習(xí) SDK:cuDNN, TensorRT, NCCL, CUDA-X
? 深度學(xué)習(xí)顯卡選擇