有时候我们的推理引擎是通过python脚本调用的,比如:
python脚本调用TensorRT engine进行推理。
如果我们想用nsight system 分析性能,该怎么搞呢?
方法如下:
首先直接nsys profile 后面跟要执行的python命令就行
$ nsys profile \python /path/to/your/script.py \<your script.py's parameters>
需要注意的是:
- 这个python脚本需要自己结束运行,不能手动ctrl C结束,不然会将nsys一起结束,nys就不会执行将它临时保存的 /tmp/nsys-report-4b9e.qdstrm文件转成*.nsys-rep文件的操作了
- 如果不指定保存路径,最后生成的nsys-rep文件会保存在执行命令的当前文件夹下
得到nsys-rep文件后,使用nsys-ui,选择文件->open打开。就可以进行分析了(当然前提是已经会使用nsys-ui)