2.4 相似性度量(Similarity Metrics) 2.4 相似性度量(Similarity Metrics) 在向量数据库系统中,相似性度量并非一个附属功能,而是整个检索逻辑的基石。它定义了“相似”的数学含义,决定了数据点之间的亲疏关系,并最终塑造了用户所感知的智能程度。Chroma作为现代嵌入式向量存储与检索系统的代表,其对相似性度量机制的设计尤为关键——这不仅关乎算法效率,更直接影响语义理解的准确性与应用场景的适配性。本文将从理论根基出发,深入剖析Chroma所支持的核心相似性度量方法:欧氏距离(L2 Distance)、余弦相似度(Cosine Similarity)与点积(Dot Product),并探讨如何在纷繁复杂的现实任务中做出合理选择。