深度学习入门:神经网络与反向传播


文档摘要

深度学习入门:神经网络与反向传播 神经网络基础 感知机(Perceptron) 基本单元: 多层感知机(MLP) 结构: 前向传播: 激活函数 Sigmoid Tanh ReLU(推荐) Leaky ReLU 损失函数 均方误差(MSE) 交叉熵损失 反向传播 数学推导 链式法则: 实现 优化算法 随机梯度下降(SGD) 动量法(Momentum) Adam(推荐) 正则化技术 L1/L2 正则化 Dropout Batch Normalization 实战示例 手写数字识别(MNIST) 常见问题 梯度消失/爆炸 解决方案: 使用 ReLU 激活函数 Batch Normalization 权重初始化(Xavier/He) 过拟合 解决方案: 增加数据量 Dropout L1/L2


发布者: 作者: 转发
评论区 (0)
U