第2章 相似匹配——万物皆可Embedding   第一章我们简单介绍了Embedding的概念,我们知道Embedding可以用来表示一个词或一句话。读者可能会有困惑,这和ChatGPT或者大模型有什么关系,为什么需要Embedding?在哪里需要Embedding?这两个问题可以简单用一句话概括:因为需要获取“相关”上下文。具体来说,NLP不少任务以及大模型的应用都需要一定的“上下文”知识,而Embedding技术就用来获取这些上下文。这一过程在NLP处理中也叫“相似匹配”——把相关内容转成Embedding表示,然后通过Embedding相似度来获取最相关内容作为上下文。