12.1 $$ E(h ; \mathcal{D})=P{\boldsymbol{x} \sim \mathcal{D}}(h(\boldsymbol{x}) \neq y) $$ [解析]:该式为泛化误差的定义式,所谓泛化误差,是指当样本$x$从真实的样本分布$\mathcal{D}$中采样后其预测值$h(\boldsymbol{x})$不等于真实值$y$的概率。在现实世界中,我们很难获得样本分布$\mathcal{D}$,我们拿到的数据集可以看做是从样本分布$\mathcal{D}$中独立同分布采样得到的。在西瓜书中,我们拿到的数据集,称为样例集$D$[也叫观测集、样本集,注意与花体$\mathcal{D}$的区别]。 12.