6.2.1 张量处理单元(TPU)间的光互连


文档摘要

6.2.1 张量处理单元(TPU)间的光互连 在数据中心的深谷之中,当数万个张量处理单元(TPU v4 或 TPU v5e)同步启动一个千亿参数模型的分布式训练时,真正决定“收敛速度”的,往往不是算力峰值,而是——光。不是隐喻意义上的光,而是波长为1310 nm、调制速率为112 Gbps per lane、采用PAM4编码、经硅光子集成芯片(SiPh IC)封装后以微米级精度耦合进氮化硅(SiN)波导的那束真实物理光。它不走铜线,不绕PCB,不经过PCIe交换机,而是从一颗TPU的光引擎出发,横跨2.7米长的主动式光纤阵列(Active Optical Cable, AOC),在亚纳秒级延迟内抵达另一颗TPU的接收端——这束光,就是TPU集群的神经突触。


发布者: 作者: 转发
评论区 (0)
U