6.1.1 纯向量kNN搜索 在向量数据库与语义检索的工程实践中,“纯向量kNN搜索”绝非教科书里那个被轻描淡写带过的数学定义——它是一条贯穿数据预处理、索引构建、查询调度、硬件适配与精度权衡的完整技术链路。它不是“把向量丢进去,返回最近的k个”,而是:当百万级768维BERT嵌入涌入内存时,如何在3毫秒内完成一次高召回、低延迟、可复现的相似性判定?当GPU显存只有24GB而向量总量达10亿时,如何让FAISS不崩溃、Annoy不退化、HNSW不陷入无限跳转?当业务方突然要求“必须保证top-1准确率≥99.2%,且P99延迟≤8ms”,你手里的那行 ,究竟在底层做了什么? 我们不谈抽象概念,不讲“向量是点,距离是相似度”这类常识性比喻。