2.4.2 余弦相似度(Cosine Similarity) 2.4.2 余弦相似度(Cosine Similarity) 在向量数据库的浩瀚宇宙中,衡量两个高维对象之间“相近”与否的方式,远非欧氏距离那般直观。当我们处理文本、图像、音频乃至多模态嵌入时,数据往往呈现出稀疏性、高维性和语义结构性——这些特性使得传统的几何距离难以捕捉其本质关联。正是在这样的背景下,余弦相似度(Cosine Similarity)作为一种基于方向而非幅度的度量方法,脱颖而出,成为现代向量检索系统中的核心支柱之一。在Chroma这一专为AI应用而生的开源向量数据库中,余弦相似度不仅是一个可选的距离函数,更是一种对高维语义空间深刻理解的体现。