ANN搜索算法 聪明的你已经知道暴力搜索是如何工作的:当你要搜索一个向量时,它会计算这个查询向量与数据库中所有其他向量的相似度(如欧氏距离或余弦相似度),然后排序返回最相似的前K个结果。这种方法的优势在于结果的绝对准确性,因为它比较了所有可能性。但这也是其最大的劣势,因为计算成本与数据量成正比(O(N)复杂度) 。当数据量从几千增长到百万、千万甚至亿级时,一次查询的耗时可能从毫秒级增加到分钟、小时甚至无法接受,无法满足实时应用的需求。此外,在高维空间中,所有点对之间的距离会变得非常接近,这使得区分真正近邻的难度增加,暴力搜索的效率会进一步降低,这一现象被称为“维度灾难”。具体维度灾难是怎么影响向量搜索,可以详细查看【向量搜索算法基础】这一章节。 什么是ANN搜索?