ubuntu环境上,安装cuda,会自动安装一些工具nvcc ,nvprof nvcc-gdb....
1.编译生成可执行文件
2.nvprof ./test
可以把性能分析数据输出到文件中
nvprof ./test -o test.nvvp
可以把在nvidia visual profiler现实更加直观
一些常用的配置参数:
-
achieved_occupancy参数:每个sm在每个cycle能够达到的最大activewarp 占总warp的比例。
nvprof --metrics achieved_occupancy ./a.out
-
gld_throughput: global load throughput (查看memory 的throughput)
nvprof --metrics gld_throughput ./a.out
-
gld_efficiency: global memory loadefficiency: device memory bandwidth的使用率
nvprof –metrics gld_efficiency ./a.out
-
查看运行时候的信息:IPC(instruction per cycle)
nvprof --metrics ipc ./a.out
-
查看所有的以上信息:
nvprof --metrics all ./a.out