问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

AI驱动光互联创新:阿里云专家详解光模块发展趋势与挑战

创作时间:
作者:
@小白创作中心

AI驱动光互联创新:阿里云专家详解光模块发展趋势与挑战

引用
腾讯
1.
https://new.qq.com/rain/a/20240524A07I3X00?media_id=&openApp=false&suid=&web_channel=wap

随着AI技术的快速发展,数据中心光互联技术正迎来前所未有的变革。阿里云光网络技术专家陈钦在2024中国光通信高质量发展论坛上发表主题演讲,深入探讨了AI对光互联技术的需求和挑战。

AI驱动光模块需求激增

AI应用的普及带来了海量的光模块需求。陈钦指出,在AI网络中,GPU卡和800G光模块数量的比例约为1:3。随着Scale-up GPU网络的发展,光模块的需求和成本支出在AI集群中的占比将大幅上升。

光模块技术演进加速

AI的快速发展也催化了光模块技术的演进。过去,主流光模块每4年更新一代,而如今这一周期已缩短至2年。这种变化对整个光模块生态提出了新的挑战。

AI网络对光互联稳定性提出双重挑战

AI大模型训练对光互联的稳定性要求极高,当前AI网络稳定性的挑战主要来自两方面:

  • 硬件层面:光器件失效是主要问题,包括激光器和探测器失效。行业标准GR468对光模块和光芯片的测试标准过于宽松,无法满足AI网络的需求。阿里云已提出更为严格的标准。

  • 软件层面:高速光模块普遍使用CMIS管理协议,虽然功能强大,但增加了系统设备和模块的交互复杂性。陈钦建议光模块厂家应加强集成适配测试。

功耗挑战与TRO技术

随着光模块速率的提升,功耗问题日益凸显。2018年PAM4 DSP的出现使得光的功耗开始超过电的功耗,成为网络中功耗占比最高的部分。为应对这一挑战,业界提出了LPO、TRO、CPO等技术方案。

  • CPO技术:虽然能有效降低功耗,但其封闭的生态不符合数据中心开放解耦的要求,运维难度也较大。

  • LPO方案:在功耗、成本和时延上有显著优势,但在标准化和互联互通方面面临挑战。

  • TRO技术:通过去掉一半DSP,在降低功耗的同时保证链路性能,且更易制定标准和实现互联互通,因此被认为是最有潜力的下一代光互联技术方案。

本文原文来自腾讯新闻。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号