5.1.1 基于深度强化学习 (DRL) 的动态资源分配 5.1.1 基于深度强化学习 (DRL) 的动态资源分配 在SAGIN(Space-Air-Ground Integrated Network,空天地一体化网络)中,动态资源分配如同指挥一场高空芭蕾:卫星、无人机和高空平台在瞬息万变的信道条件下争抢频谱、功率和计算资源。一旦分配失误,轻则延迟飙升,重则网络瘫痪。传统优化算法如凸优化或遗传算法虽可靠,却在面对SAGIN的非凸、非平稳环境时力不从心——信道衰落随机,节点移动迅猛,用户需求如潮水般涌来。深度强化学习(DRL)横空出世,它不只是优化工具,更是智能决策者,能通过试错学习适应未知动态。想象你是一位卫星基站的“空中调度员”,DRL就是你的第六感,帮助你实时决策资源下发。