8.1.1 基于强化学习的布局布线优化 在芯片设计的深水区,布局布线(Placement & Routing, P&R)从来不是一道“解得出来就行”的数学题——它是一场在数十亿晶体管、上千个时序路径、数百种工艺约束之间走钢丝的精密平衡术。当传统算法在7nm以下节点频频失速:全局布线拥塞率预测误差超过35%,时序违例修复迭代次数突破20轮,功耗热点收敛周期动辄以周计……我们终于不得不承认:那个靠手工调参、靠经验直觉、靠“试错-回滚-再试错”驱动的P&R时代,正在不可逆地退场。 而强化学习(Reinforcement Learning, RL),正以一种近乎挑衅的姿态闯入这个被EDA巨头牢牢把持了三十年的堡垒。它不满足于拟合静态规则,也不甘于局部梯度下降;