2024.6.13回忆版
-
矩阵向量乘不可整除代码
-
集合通信与点对点通信的区别
-
块划分、循环划分、循环块划分(14个向量,4个进程)
-
按行访问还是按列访问快
-
SISD系统问题
-
循环依赖问题
问题:为什么不能对这个循环并行化,请你写出一种循环并行化的方法,并写出OPENMP并行化的代码
-
CUDA指出代码有什么性能问题改进
-
八、
- 1、cache一致性是什么,常用解决方法,简述工作原理
- 2、什么是cacje伪共享,以及:
-
奇偶排序,说明代码有什么性能问题,并改进