第3章句词分类——句子Token都是类别


文档摘要

第3章 句词分类——句子Token都是类别   上一章我们介绍了相似匹配相关的基础,以及使用相似匹配技术能够实现的任务和应用。相似匹配以Embedding为核心,关注的是如何更好地表示文本。基于Embedding的表示往往是语义层面的,一般使用余弦相似度来衡量。我们也提到了,其实不光文本可以Embedding,其实任意对象都可以Embedding,这一技术广泛应用在深度学习算法各个领域。   本章我们关注NLP领域最常见的两类任务:句子分类和Token分类,由于中文的字也是词,所以也会叫作句词分类。我们将首先介绍句子分类的基础,包括相关的一些常见任务,以及如何对句子和Token进行分类。


发布者: 作者: 转发
评论区 (0)
U