7.1.2 内存访问:纹理缓存与带宽 在GPU计算的浩瀚星图中,纹理缓存(Texture Cache)从来不是一块安静的“配角缓存”——它是一条被精心设计、高度特化的数据通路,是图形渲染与通用计算之间最富张力的交汇点。当我们在7.1.2节直面“内存访问:纹理缓存与带宽”这一命题时,我们面对的绝非教科书里一句轻描淡写的“纹理缓存具有空间局部性优化”,而是一场关于硬件微架构约束、访存模式建模、编译器调度策略与程序员显式干预能力的四重奏。它关乎每一帧延迟是否跌破16ms,关乎一个3D重建kernel的吞吐量能否从85 GFLOPS跃升至112 GFLOPS,更关乎你在调试一个莫名其妙的 骤降50%的诡异问题时,最终是否能拨开迷雾,揪出那个藏在 调用背后的bank conflict元凶。