CUDA command Profiler
這里我不使用默認設置:
timestamp gpustarttimestamp gpuendtimestamp gridsize threadblocksize dynsmemperblock stasmemperblock regperthread memtransferdir memtransfersize memtransferhostmemtype streamid localblocksize
將上面的內容添加到一個新的文本文件中。假設這個文件叫prof.cfg
假設你的程序是a.exe
用下面的命令啟動執(zhí)行
CUDA_PROFILE=1?CUDA_PROFILE_CONFIG=prof.cfg?./a.exe
此時會有一個文件產生在你的目錄下,打開看看吧。





