神经网络的激活函数(三)ReLU和它的变种Leaky ReLU、PReLU 本文我们介绍深度学习的功臣ReLU及其变种,它们在神经网络中的广泛应用,对于提高网络的性能和加速训练具有重要意义。 ReLU函数 3 1.1 定义 ReLU(Rectified Linear Unit,修正线性单元)激活函数是现代深度学习中最常用的激活函数之一。它的数学表达式为: $$\text{ReLU}(x) = \max(0, x)$$ 1.2 关键性质 非线性:尽管ReLU函数在正区间是线性的,但它引入了非线性特性,使得神经网络能够学习复杂的模式。 稀疏激活:ReLU函数会将输入的负值部分变为零,这意味着在实际应用中,神经元的激活是稀疏的(即只有部分神经元在激活),这有助于提高模型的效率和性能。