8.1 数据,模型与学习 此时,值得停下来思考一下机器学习算法旨在解决的问题。正如第一章所讨论的,机器学习系统主要由三个部分组成:数据、模型和学习。机器学习的主要问题是“我们所说的好模型是什么意思?”。“模型”这个词有很多微妙之处,我们将在本章中多次重新探讨它。同时,如何客观地定义“好”这个词也并非完全显而易见。机器学习的一个指导原则是,好的模型应该在未见过的数据上表现良好。这要求我们定义一些性能指标,如准确率或与真实情况的距离,并找出在这些性能指标下表现良好的方法。本章将介绍一些常用于讨论机器学习模型的数学和统计语言的基本要素。通过这样做,我们简要概述了训练模型的最佳实践,以便得到的预测器在尚未见过的数据上表现良好。 1723896778481 表8.