问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

麻省理工学院:超低延时、超低能耗深度光子神经网络芯片

创作时间:
作者:
@小白创作中心

麻省理工学院:超低延时、超低能耗深度光子神经网络芯片

引用
1
来源
1.
https://www.opticsjournal.net/J/NewOptics/news/PT2412220001283Z6c9.html

深度神经网络(DNN)是现代人工智能(AI)的核心推动力。随着计算能力的提升和数据规模的扩大,深度学习模型变得越来越庞大和复杂,传统电子计算硬件逐渐难以支撑。这些模型不仅需要快速计算,还要求在能耗方面保持高效。现有的电子硬件在面对规模化计算时往往表现一般,而光学系统可以以极高的效率执行线性矩阵和非线性运算,可以突破传统电子计算硬件的限制。

近日,麻省理工学院研究人员实验演示了一种完全集成的相干光学神经网络架构,用于具有六个神经元和三层神经网络。该网络计算光学线性和非线性函数只需要410ps的延迟,并在六类元音分类任务中实现了92.5%的准确率,训练数据吞吐量提高了几个数量级。相关研究成果发表在Nature Photonics上。(doi:https://doi.org/10.1038/s41566-024-01567-z)

非线性单元的创新:光子计算与先进算法的完美融合

人工智能算法,尤其是深度神经网络(DNN),依赖大量以线性代数为主的计算,如矩阵乘法和向量内积。这类计算通常需要高性能硬件支持,但随着模型复杂度和数据规模的增长,计算需求激增,现有电子硬件面临散热和能效的瓶颈。芯片发热问题限制了计算效率和硬件寿命。相比之下,光子计算凭借高速传输和低能耗的优势,可以显著提高效率并降低散热需求。光学硬件利用光学器件进行并行计算,能高效处理复杂的神经网络任务,在大规模并行计算中展现巨大潜力。

光子深度神经网络是一种结合光子计算与深度学习的新兴技术,旨在通过光子硬件实现高效的神经网络计算。与传统基于电子的神经网络不同,光子神经网络利用光的特性(如高速度和低能耗)来处理数据,能够在能效和计算速度上取得显著优势。在该研究中,研究人员提出创新的非线性单元设计来实现相干光子神经网络架构,如图1所示,该架构由多个层和相互连接的神经元构成,数据在这些神经元与层之间流动,并完成复杂的计算任务。这些计算和实时推理过程直接在光信号上进行训练,保留相位信息,无需耗费大量功耗。此外,光学系统可以利用波长和偏振复用来实现大规模并行计算,从而进一步提高系统的吞吐量。除此之外,研究人员还报告了推理和现场训练的端到端相干光学深度神经网络的首次演示,通过将用于矩阵代数和非线性运算的多个光学处理器单元集成到单个光子芯片中,实现了三层深度神经网络的低延时相干光学处理。


图1 相干光子深度神经网络结构示意图

光子芯片的超低能耗和超低延时验证

研究人员基于商业的光子芯片制造厂实现了相干光子深度神经网络。图2显示了采用绝缘体上硅工艺制造的光子芯片,它单片集成了所有的相干光子深度神经网络子系统,包括低损耗边缘耦合和波导、紧凑型移相器、高速波导集成锗硅光电探测器和高效微环调制器。在此基础上,研究人员利用相干矩阵乘法单元实现深度神经网络的线性变换,相干矩阵乘法单元包含一个由15个器件组成的MZI网格,可对光场实现任意6×6幺正变换。为了验证光子计算系统的性能,研究人员将2500个随机生成的6×6酉矩阵编程到设备中,并测量了其保真度。结果显示,光子芯片的保真度高达0.989±0.008,这一结果刷新了可编程光子矩阵处理器的保真度记录,显示了其在高精度计算任务中的巨大优势。值得一提的是,整个过程完全依赖于光学原理,不需要额外的电子设备,从而显著降低了能量消耗。每次计算操作的能量消耗仅为4.9皮焦耳(pJ),远低于传统电子计算系统的能耗


图2 制备的光子计算芯片显微镜图

除了高能效外,光子计算系统还具备极低的延迟度。研究人员在测试中发现,整个深度神经网络的训练和推理过程都能在不到半纳秒的时间内完成。这一速度优势使得光子计算在面对大规模数据和复杂模型时,能够迅速做出响应,极大提升了计算效率。与传统的电子计算系统相比,该系统不仅能够完成更复杂的任务,还能够在更短的时间内给出结果,充分展现了光子计算在实时数据处理和大规模计算中的潜力。在机器学习任务中的测试结果也证明了该光子芯片的卓越性能。

研究表明,在训练阶段,该光子芯片的准确率超过了96%;在推理阶段,其准确率也达到了92%以上。这一表现与目前最先进的传统电子硬件相媲美,显示了光子计算在深度学习应用中的广泛前景。通过这种创新的光子计算平台,研究人员展示了光子技术在深度神经网络和人工智能领域的巨大应用潜力,未来有望成为推动人工智能发展的重要力量。


图3 无反向传播原位训练

总结与展望

这项研究不仅展示了光子芯片在深度学习中的强大计算能力,也为未来光子计算系统的创新提供了参考。凭借其高能效、超低延迟和高精度,光子计算系统有望在大数据处理、人工智能和量子计算等领域发挥重要作用。与传统电子计算系统相比,光子计算突破了能耗和速度的限制,能够提供更高效的计算解决方案。随着技术的不断进步,光子计算将为科技发展带来新的机遇,推动人工智能和量子技术的飞跃发展。

中国激光杂志社刊群关注相关领域的前沿进展,出版了一系列光学神经网络、光计算的相关文章,
欢迎点击阅读:

[1]Jingxi Li, Tianyi Gan, Bijie Bai, Yi Luo, Mona Jarrahi, Aydogan Ozcan, "Massively parallel universal linear transformations using a wavelength-multiplexed diffractive optical network," Adv. Photon. 5, 016003 (2023)

[2]Trevon Badloe, Seokho Lee, Junsuk Rho, "Computation at the speed of light: metamaterials for all-optical calculations and neural networks," Adv. Photon. 4, 064002 (2022)

[3]Wenkai Zhang, Bo Wu, Wentao Gu, Junwei Cheng, Hailong Zhou, Dongmei Huang, Ping-kong Alexander Wai, Liao Chen, Wenchan Dong, Jianji Dong, Xinliang Zhang, "Large-scale optical programmable logic array for two-dimensional cellular automaton," Adv. Photon. 6, 056007 (2024)

[4]Run Sun, Tingzhao Fu, Yuyao Huang, Wencan Liu, Zhenmin Du, Hongwei Chen, "Multimode diffractive optical neural network," Adv. Photon. Nexus 3, 026007 (2024)

[5]Ilker Oguz, Jih-Liang Hsieh, Niyazi Ulas Dinc, U?ur Te?in, Mustafa Yildirim, Carlo Gigli, Christophe Moser, Demetri Psaltis, "Programming nonlinear propagation for efficient optical learning machines," Adv. Photon. 6, 016002 (2024)

本文原文来自Optics Journal,原文链接:https://www.opticsjournal.net/J/NewOptics/news/PT2412220001283Z6c9.html

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号