问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Nature发文:中科院研制成功超高集成度光学卷积处理器

创作时间:
2025-01-22 05:27:05
作者:
@小白创作中心

Nature发文:中科院研制成功超高集成度光学卷积处理器

随着人工智能和深度学习的快速发展,卷积神经网络(CNN)已成为图像处理领域的主流技术。然而,传统的通用处理器在处理大规模卷积运算时存在性能瓶颈。因此,针对卷积运算的专用集成电路(ASIC)设计成为研究热点。本文将介绍一种卷积计算芯片的结构设计,并探讨最新的光学卷积处理器技术。

卷积芯片内部模板框图

该设计包含两个主要数据通路:图像数据通路和模板数据通路。

  • 图像数据通路:经过帧控制、实时图SPRAM(写控制、SPRAM读控制、数据读控制)、计算单元
  • 模板数据通路:经过模板SPRAM、计算单元

运算单元像素寄存器控制

  • 存储SPRAM写入的64bit数据,输出为8bit
  • 当处于读操作时,输出的读使能信号fifo_rd_en,该信号使FIFO读出数据并写入SPRAM中
  • 图像SPRAM地址控制:SPRAM中滚动存放32行像素,为了同时读出相邻4行数据,写入数据按行在4个块中依次循环存放
  • 32*40像素模板卷积运算分8次局部卷积运算完成

计算模块的结构

  • 乘法器1个,后面是加法器6个,组成流水线结构
  • 同时处理6组数据,流水线深度为7拍(1个乘法器+6个加法器)
  • 第六组数据刚进入第一个拍(乘法器)时,第一组数据在第六个拍(加法器5)处理
  • 计算模块大小为4行40列,整个卷积设计大小为32行40列
  • 数据缓存根据计算模块大小(4行40列)设定
  • 整个卷积设计调用8次计算模块(“32行40列”是“4行40列”的8倍),每次结果累加
  • 计算模块结果在另一位置缓存,每次结果与对应位置数据累加后写回该位置
  • 寄存器位宽设置为26bit(初始像素数据8bit,经过1次乘法和6次加法,结果22bit,累加8次,最终设定26bit)

卷积芯片的新设计方式:光学卷积处理器(OCPU)

光学卷积处理器(Optical Convolution Processing Unit,OCPU)是一种基于光学计算的技术,它使用光学器件和光学现象进行信息处理和计算。光学能够同时处理多个信息,从而实现高效的并行计算。

中国科学院半导体研究所集成光电子国家重点实验室微波光电子研究组开发了一种超高集成度光学卷积处理器,相关研究成果发表在《Nature-Communications》上。这项技术在人工智能领域具有广阔的前景。光学计算具有带宽大、延迟低、功耗低的优点。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号