华为段建宏：标准生态是LPO商用落地关键

2024/07/09 09:17 C114通信网

　　在日前召开的“2024中国光网络研讨会”上，华为技术有限公司光模块高级技术专家段建宏发表题为《AI场景光模块的技术趋势及面临的挑战》的主题演讲。

　　他表示，大模型之战带来模型规模和训练算力需求爆发式增长，智算中心是业界AI模型开发的共同选择。业界主流模型从千亿稠密到万亿稀疏，逐步走向百万级超长序列和多模态，稳定性、高性能为AI大集群客户核心诉求。

　　“文本、图像乃至视频AI的高速发展对算力规模提升提出更大挑战，千卡/万卡等高效互联的AI集群是必然发展趋势，而高速网络互联是提升系统集群算力的关键一环。”

　　段建宏指出，光模块“麻雀虽小，五脏俱全”，在AI计算网络典型组网中的应用广泛，可在参数面网络用于智能集群分布式训练，业务面网络用于系统业务调度和管理，存储面网络用于访问存储区数据，光模块/AOC用于三张网络中的长距接入和设备互联。

　　同时，智算中心机房内互联以2km为主，端口速率已到800G，持续向高速率(1.6T/3.2T)演进中。并且未来5年短距光模块将快速增长，AI集群光模块份额占比从2023年的25%提升到2028年的38%，800G光模块在今年上量部署，1.6T光模块预计在2026年上市。

　　段建宏提出了AI场景下光模块的技术趋势及面临的挑战。他认为，AI场景下光互联技术高速发展，呈现差异化的特性需求。其中，联接速率高，需要大宽带;互联规模大，需要低功耗、低时延;因性能/可靠性导致的闪断影响训练业务，需要稳定、高可靠;智能运维，开局或者过程检测，快速故障定位，需要高可用。

　　具体来说，在大带宽方面，224G/Lane待进一催熟，高速率对传输距离影响待进一步研究，此外，还有小型化封装低功耗、散热问题。

　　低功耗、低时延方面，LPO 具备相对优势，但持续演进仍有待讨论。另外标准生态是LPO落地商用的关键，互通性应用还在进一步研究。速率提升加速单模下沉，硅光预估迎来高速增长。

　　高可靠方面，AI计算对光互联高可靠提出挑战，要求系统端到段设计优化;系统与光模块优化系统风道设计，光模块联合散热优化;光器件合理提升系统集成度;光芯片优化芯片设计，降低缺陷率，降低电流密度，提升发光线率。

　　高可用方面，高速率模块链路洁净度要求更高，且高密光互联架构，故障定位代价大，AI网络需要注入智能化技术，提升运维效率，AI场景下光模块智能运维助力系统实现高可用特性。

　　榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn（把#换成@）。