9.1.4.1 架构与性能差异 9.1.4.1 架构与性能差异:当 Faiss 的 在千万级向量检索中突然“失速”——一个被忽略的 与 耦合陷阱 你有没有经历过这样的深夜调试现场? 模型训练完毕,特征提取稳如磐石,Faiss 索引构建完成, 耗时合理, , , , ——所有参数都抄自官方 benchmark 文档,甚至比它还“保守”。你信心满满地跑起 ,输入 batch=128 的 query 向量,期望毫秒级响应。结果呢? 第一次搜索耗时 142ms;第二次 187ms;第三次……2.3 秒。 不是偶发抖动,是持续恶化。内存占用缓慢爬升,GPU 显存没涨,但 CPU 使用率死死咬在 98%, 里 进程的 每秒涨 15MB。