1.1.2 关键术语（Embedding、ANN、kNN）

文档摘要

1.1.2 关键术语（Embedding、ANN、kNN）我们常常在深夜调试向量检索服务时，盯着日志里那行发出一声轻叹——这背后没有魔法，只有一串被反复锤炼的数学直觉、内存布局选择、距离函数权衡，以及对浮点误差近乎偏执的校准。今天，我们就把“Embedding、ANN、kNN”这三个词从PPT里的概念标签，真正拆解成可编译、可调试、可压测、可上线的工程实体。不谈“向量是高维空间中的点”这种教科书式比喻，我们要问：当一个 768 维的 float32 向量从 PyTorch 张量落地为 3072 字节的连续内存块，它如何在毫秒内从一亿个同类向量中被揪出来？它的邻居为什么“近”，又凭什么被判定为“第 k 个最近”？