新型晶圆级芯片或将重塑人工智能未来,提升能效与环保性
时间:2025-06-20 15:35
小编:小世评选
随着人工智能技术的迅猛发展,计算机硬件的效率需求越来越高。近年来,加州大学河滨分校的工程师们在《设备》杂志上发表了一篇技术评论,探讨了新型晶圆级计算机芯片的潜力,这种芯片不仅能够为人工智能提供强大的计算能力,还更加环保,成为未来计算机硬件的一个重要方向。
研究团队的主要作者、伯恩斯工程学院的电气与计算机工程教授米赫里·奥兹坎(Mihri Ozkan)表示,晶圆级处理器是一项具有革命性的技术创新。这种技术允许在单一晶圆上整合多种功能组件,从而消除了传统芯片间通信所造成的延迟和功耗损失。这种高效的集成方式为处理数万亿个参数的复杂人工智能模型提供了更快的运行速度和更高的能源效率,满足了日益增长的计算需求。
在论文中,研究团队强调了晶圆上芯片封装等先进技术所带来的优势。这些技术不仅使得晶圆级设计更为紧凑和易于扩展,而且在计算密度上有着显著提升,可能提高高达40倍的计算密度。这一特性尤为重要,因为大型人工智能模型的训练和推理过程消耗大量的计算资源和能源。
Cere
as WSE-3芯片是该领域的前沿代表,采用台积电(TSMC)的5纳米工艺,集成了超过4万亿个晶体管和90万个专为人工智能优化的核心,具有惊人的21PB/s内存带宽。相较之下,Tesla Dojo的模块化设计,每个训练单元包含1.25万亿晶体管和8,850个核心,通过特斯拉特有的传输协议实现低延迟通信。虽然两者各有优势,但WSE-3在计算吞吐量和延迟表现方面均展现了优异的能力,尤其是在碳捕获模拟领域,WSE-3的性能超越NVIDIA H100芯片达210倍之多。
能效作为评估人工智能硬件的关键指标,自然成为了讨论的焦点。WSE-3通过消除芯片间的数据传输,实现在每瓦特能耗下的性能提升,达到了前所未有的水平。其创新的“引擎块”设计结合了水-丙二醇冷却回路,能够处理23kW的热设计功耗(TDP)。与之相比,Tesla Dojo采用去离子水直接冷却,每个训练单元的功耗为15kW,而NVIDIA H100的能效仅为7.9TFLOPS/W,依赖液态冷却系统以应对高达700W的功耗。
晶圆级芯片的最大挑战在于制造良率的提高。为了应对核心缺陷问题,Cere
as采用了SwarmX互连架构,实现了缺陷核心的动态绕行,从而声称具备高达100倍的缺陷容忍能力。Tesla Dojo也采用了先进的集成扇出(InFO)封装技术,将多个芯片集成在一个载具晶圆上,这些技术都代表了半导体制造领域的最新进展。
奥兹坎教授形象地将传统GPU比作繁忙的高速公路,虽然效率高,但常常因交通堵塞而造成能源浪费。而晶圆级引擎则更像是单轨列车:直接、高效、污染更少。他指出,晶圆级系统在加速可持续性研究方面的推动作用,不仅对计算领域至关重要,对地球的环境保护同样意义深远。
研究团队的论文还提到,一个系统高达86%的总碳足迹可能来自制造和供应链,而不仅仅是能源使用。因此,他们倡导在设计和生产过程中采用可回收材料和低排放合金,并强调全生命周期设计的重要性。“要真正降低计算对环境的影响,我们需要从晶圆开始思考整个流程。”奥兹坎道。
通过这项深度跨学科合作的成果,研究团队希望能为研究人员、工程师和政策制定者提供一条探索人工智能硬件未来的路线图。他们的愿景是,新的晶圆级芯片能够成为推动人工智能及其应用可持续发展的重要力量,引导行业向更高效、更环保的方向发展。
晶圆级芯片的崛起不仅代表着计算能力的一次飞跃,更是人工智能技术走向可持续未来的重要里程碑。随着科研的不断深入,未来的人工智能将可能在更高的能效和更低的环境影响下,创造出更为广泛的应用场景。