中国清华大学的一篇新论文描写了专门用于计算机视觉任务的超快速、人工智能处理芯片的开发和运行。该芯片名为电子与光计算相结合的全摹拟芯片 (ACCEL),在专门的架构中利用光子和摹拟计算,能够在图象分类工作负载中提供 Nvidia A100 3.7 倍以上的性能。是的,它是一款用于视觉任务的专用芯片,但我们不应当将其视为市场碎片化,而是可以将其视为迈向异构计算未来的又一步,其中半导体愈来愈多地设计用于满足特定需求,而不是“捕获”。所有”配置。
正如《自然》杂志上发表的论文所述,摹拟的 ACCEL 处理器在视觉任务中到达了每秒 4,600 次万亿次运算 (TOPS)。与 Nvidia 的A100(Ampere)相比,这具有 3.7 倍的性能优势,后者在 INT8 工作负载(稀疏)中的峰值为 1,248 TOPS。根据该研究论文,ACCEL 的系统能源效力为每秒每瓦 74.8 peta 操作。尔后,Nvidia 的 A100 被 Hopper 及其 800 亿晶体管 H100 超级芯片所取代,但即使如此,与这些结果相比,这看起来也其实不使人印象深入。
ACCEL 仿佛是专用集成电路 (ASIC) 设计的摹拟版本。这正是电子摹拟计算 (EAC) 单元的作用,由于它可以重新配置其中的摹拟路径以加速特定任务。将这些视为芯片内的预编程算法,由 EAC 调和应将哪一种配置利用于哪一个任务。
研究团队联合负责人戴琼海表示:“为人工智能时期开发新的计算架构是一项成绩。但更重要的挑战是将这类新架构落地到实际利用中,解决国家和公众的重大需求,这是我们的责任。”
新的光子和摹拟 ACCEL 芯片可能会让人想起 IBM 较近发布的另外一款摹拟 AI 加速芯片(Hermes)。或许有趣的是,即便对中国实行了所有制裁,该国的研发仍使其能够迎头遇上,并且在某些方面明显有所改进,不管它们遭到甚么阻碍。能够绕过限制无疑是中国斟酌制裁的方式。
一样重要的是要了解这一代基于光子学的摹拟芯片正在极为轻松的光刻水平上进行加工。例如,ACCEL 是采取标准 180 nm CMOS 技术制造的,用于电子摹拟计算单元 (EAC)——操作的大脑。固然,通过进一步小型化工艺以实现更低的 CMOS 节点(Nvidia 的 H100 采取 4 nm 工艺制造),可以进一步提率。目前还不清楚可以做哪些进一步的工作来小型化光学摹拟计算(OAC)模块。
大范围实行 ACCEL 等摹拟计算系统仿佛更多的是制造吞吐量和行业适应性的问题,而不是物理上不可能的问题。但高性能人工智能摹拟芯片仍未大范围部署是有缘由的:目前其制造水平太低,没法满足研究工作和原型工作之外的任何需求。我们现在没有足够的吞吐量或可用的能力将这些芯片添加到台积电等公司已的 2025 年制造中,但在扩大范围之前始终需要这些实验结果。此类芯片的市场非常希望具有它们。较终,这都是计划、支出和时间的问题。