1.1.2 关键术语(Embedding、ANN、kNN)


文档摘要

1.1.2 关键术语(Embedding、ANN、kNN) 我们常常在深夜调试向量检索服务时,盯着日志里那行 发出一声轻叹——这背后没有魔法,只有一串被反复锤炼的数学直觉、内存布局选择、距离函数权衡,以及对浮点误差近乎偏执的校准。今天,我们就把“Embedding、ANN、kNN”这三个词从PPT里的概念标签,真正拆解成可编译、可调试、可压测、可上线的工程实体。不谈“向量是高维空间中的点”这种教科书式比喻,我们要问:当一个 768 维的 float32 向量从 PyTorch 张量落地为 3072 字节的连续内存块,它如何在毫秒内从一亿个同类向量中被揪出来?它的邻居为什么“近”,又凭什么被判定为“第 k 个最近”?


发布者: 作者: 转发
评论区 (0)
U