2.3.1 实例级与设备级扩展枚举 在现代异构计算系统中,当一个GPU驱动程序加载、一个PCIe设备热插拔发生、或一个虚拟化环境动态分配资源时——你是否曾想过:系统究竟是如何在毫秒级内识别出“这是一块NVIDIA A100”,“它支持CUDA 12.4的实例化能力”,“其MIG切分粒度可精确到1/7个GPU”,以及“当前已启用3个独立的MIG实例”? 这背后并非魔法,而是一套精密、分层、可验证且严格遵循硬件-固件-软件契约的扩展枚举机制。它不声不响地站在整个GPU虚拟化、AI推理服务编排、多租户隔离架构的最底层,却决定了上层一切调度策略能否落地、一切安全边界能否成立、一切性能承诺能否兑现。 我们今天要深入解剖的,正是这个机制中最基础也最关键的环节:2.3.1 实例级与设备级扩展枚举。