23.1 深度学习的泛化理论与逼近能力 23.1 深度学习的泛化理论与逼近能力 在人工智能迅猛发展的浪潮中,深度学习以其惊人的实证性能成为推动技术变革的核心引擎。然而,当我们从工程奇迹转向理论根基时,一个令人困惑的问题便浮现出来:为何一个拥有数百万甚至数十亿参数的神经网络,在训练数据远少于参数数量的情形下,依然能够对未见样本做出准确预测?这正是深度学习泛化理论所要回答的核心问题。与此同时,另一个基础性问题同样引人深思:神经网络究竟具备多强的函数逼近能力?它是否足以刻画现实世界中复杂的非线性关系?本章将围绕这两个相互关联又各自独立的主题——泛化能力与逼近能力,展开系统而深入的剖析。