第三章:第一节向量嵌入


文档摘要

第一节 向量嵌入 一、向量嵌入基础 1.1 基础概念 1.1.1 什么是 Embedding 向量嵌入(Embedding)是一种将真实世界中复杂、高维的数据对象(如文本、图像、音频、视频等)转换为数学上易于处理的、低维、稠密的连续数值向量的技术。 想象一下,我们将每一个词、每一段话、每一张图片都放在一个巨大的多维空间里,并给它一个独一无二的坐标。这个坐标就是一个向量,它“嵌入”了原始数据的所有关键信息。这个过程,就是 Embedding。 数据对象:任何信息,如文本“你好世界”,或一张猫的图片。 Embedding 模型:一个深度学习模型,负责接收数据对象并进行转换。 输出向量:一个固定长度的一维数组,例如 。这个向量的维度(长度)通常在几百到几千之间。


发布者: 作者: 转发
评论区 (0)
U