词嵌入(word2vec)


文档摘要

词嵌入(word2vec) :label: 自然语言是用来表达人脑思维的复杂系统。 在这个系统中,词是意义的基本单元。顾名思义, 词向量是用于表示单词意义的向量, 并且还可以被认为是单词的特征向量或表示。 将单词映射到实向量的技术称为词嵌入。 近年来,词嵌入逐渐成为自然语言处理的基础知识。 为何独热向量是一个糟糕的选择 在 :numref: 中,我们使用独热向量来表示词(字符就是单词)。假设词典中不同词的数量(词典大小)为$N$,每个词对应一个从$0$到$N−1$的不同整数(索引)。为了得到索引为$i$的任意词的独热向量表示,我们创建了一个全为0的长度为$N$的向量,并将位置$i$的元素设置为1。这样,每个词都被表示为一个长度为$N$的向量,可以直接由神经网络使用。


发布者: 作者: 转发
评论区 (0)
U