第2章相似匹配——万物皆可Embedding

文档摘要

第2章相似匹配——万物皆可Embedding &emsp;&emsp;第一章我们简单介绍了Embedding的概念，我们知道Embedding可以用来表示一个词或一句话。读者可能会有困惑，这和ChatGPT或者大模型有什么关系，为什么需要Embedding？在哪里需要Embedding？这两个问题可以简单用一句话概括：因为需要获取“相关”上下文。具体来说，NLP不少任务以及大模型的应用都需要一定的“上下文”知识，而Embedding技术就用来获取这些上下文。这一过程在NLP处理中也叫“相似匹配”——把相关内容转成Embedding表示，然后通过Embedding相似度来获取最相关内容作为上下文。