第12章:记忆的链条(LSTM与RNN) 兔狲教授的亲切开场 上一章,我们探索了反向传播的智慧——网络如何从错误中学习。但学习不仅是修正错误,还需要记住过去。今天,我们要回答一个关键问题:如何让神经网络拥有记忆? 当信息随时间流动时,网络如何保持状态,如何连接过去与现在?让我们慢慢来,探索记忆的链条。 核心议题:时间中的模式 “教授,”小小猪指着屏幕上的一段文本,“我训练的网络可以识别单词,但它好像总是‘忘记’前面的内容。比如‘我喜欢吃苹果,因为它们很……’,它应该填‘甜’,但它有时会填‘红’或‘圆’。” 中山大学康乐园的冬日清晨,晨雾笼罩着红砖建筑群。黑石屋书房里,暖气片发出轻微的嗡嗡声,窗玻璃上凝结着水珠。窗外,珠江的水面平静如镜,偶尔有晨跑的学生经过,呼出的气息在冷空气中形成白雾。