文章目录 8、常量内存(Constant Memory)9、并发访问GPU9.1 在同一GPU上同时执行两个内核9.2 Stream同步9.3 使用流和事件测量执行时间 8、常量内存(Constant Memory) 常量内存是只读缓存,其内容可以广播到块中的多个线程。 在常量内存中分配的变量需要使用特殊的__constant__标识符在 CUDA 中声明,并且它必须是全局变量,即它必须在包含内核的范围内声明,而不是在内核本身内部声明。 如果这一切听起来很复杂,请不要担心,我们将通过一个示例来了解它是如何工作的。 extern "C" { #define