目录 感知机分类与序列标注 5.1 分类问题 5.2 线性分类模型 5.3 感知机算法 5.4 基于感知机的人名性别分类 5.5 结构化预测问题 5.6 线性模型的结构化感知机算法 5.7 基于结构化感知机的中文分词 感知机分类与序列标注 第4章我们利用隐马尔可夫模型实现了第一个基于序列标注的中文分词器,然而效果并不理想。事实上,隐马尔可夫模型假设人们说的话仅仅取决于一个隐藏的{B.M,E,S序列,这个假设太单纯了,不符合语言规律。语言不是由这么简单的标签序列生成,语言含有更多特征,而隐马弥可夫模型没有捕捉到。隐马弥可夫模型能捕捉的特征仅限于两种: 其一,前一个标签是什么;其二,当前字符是什么。 为了利用更多的特征,线性模型( linear model )应运而生。