3.2.6. 文本索引 (Text Index) MongoDB 3.2 中的文本索引(Text Index)详解及实践 引言 文本索引的基本概念 什么是文本索引? 文本索引是一种特殊的索引类型,旨在支持高效的全文搜索操作。它能够快速检索包含特定关键词或短语的文档。与传统的基于精确匹配的索引不同,文本索引通过分词、权重计算等技术来处理自然语言中的复杂性。 文本索引的工作原理 分词:文本索引会将字段值分解为单独的单词(称为“tokens”),并移除常见的停用词(如“the”、“is”等)。 权重计算:每个单词都有一个权重,这取决于它在文档中的出现频率。通常,频繁出现的词权重较低,而罕见的重要词汇权重较高。 存储结构:MongoDB 将这些分词后的结果存储在一个专用的数据结构中,以便快速查找。