1.2.1 弗林分类法 (Flynn's Taxonomy)

文档摘要

1.2.1 弗林分类法 (Flynn's Taxonomy) 1.2.1 弗林分类法（Flynn’s Taxonomy）：当你的SIMD向量指令在GPU上“假装”并行，而实际在串行踩坑——一个CUDA内核里漏掉syncthreads()的血泪调试实录你有没有过这样的时刻：写完一段自以为天衣无缝的CUDA kernel，逻辑清晰、内存对齐、warp调度也符合直觉；编译通过，运行不报错，甚至在小规模数据上结果还“看起来正确”；可一旦把输入从1024扩大到65536，输出就开始随机漂移——有时差3个bit，有时整列全零，有时干脆触发非法内存访问（），但却说“没越界”？这不是玄学。这是弗林分类法在你眼皮底下悄然翻脸——它没失效，只是你忘了：分类法不是贴标签的终结，而是理解执行语义的起点。