目录 文本分类 11.1 文本分类的概念 11.2 文本分类语料库 11.3 文本分类的特征提取 11.4 朴素贝叶斯分类器 11.5 支持向量机 11.6 标准化评测 11.7 情感分析 文本分类 上一章我们学习了 文本聚类,体验了无须标注语料库的便利性。然而无监督学习总归无法按照我们的意志预测出文档的类别,限制了文本聚类的应用场景。有许多场景需要将文档分门别类地归人具体的类别中,比如垃圾邮件过滤和社交媒体的自动标签推荐。在这一章中, 我们将介绍如何实现这些需求。 11.1 文本分类的概念 文本分类( text classification),又称文档分类( document classification),指的是将一个文档归类到一个或多个类别中的自然语言处理任务。