2.3.2.2 故障恢复 (Recovery) 流程 检查点:那把悬在恢复时间头上的达摩克利斯之剑 凌晨三点,刺耳的电话铃声撕裂了宁静。监控大屏上,一条核心支付服务的数据库实例状态赫然标红——“故障恢复中”。你揉着惺忪睡眼接入终端, 的输出让你倒吸一口凉气:恢复进度缓慢,预计完成时间长达数小时。业务方催命的电话一个接一个,每一分钟的中断都意味着真金白银的损失和用户信任的流失。问题出在哪里?大概率,是那把名为“检查点”(Checkpoint)的双刃剑,在昨夜的一次批量数据处理中,未曾被妥善打磨。 在讨论 WAL(Write Ahead Log)的故障恢复流程时,我们常将目光聚焦于 REDO 日志的回放(Redo Apply)和 UNDO 日志的回滚(Undo Rollback)。