AMD 发布 ROCm 7,加速 AI 开发与计算能力提升
时间:2025-07-13 19:40
小编:小世评选
在全球技术领域,人工智能(AI)的迅猛发展正引发一场新的技术革命。作为业界领先的半导体公司,AMD(超微半导体)在 AI 计算领域的投入一直备受关注。近期,AMD 在其 Advancing AI 2025 活动上正式发布了 ROCm 7,这一全新版本的软件栈旨在进一步增强开发者的生产力,并加速 AI 的应用和部署。ROCm 7 的发布标志着 AMD 在支持 AI 加速计算方面迈出了重要的一步,尤其是在提升深度学习模型的性能和效率方面。
ROCm(Radeon Open Compute)是 AMD 专为数据中心和高性能计算(HPC)设计的开放计算。随着 AI 需求的日益增长,ROCm 软件栈得到了不断的更新与优化,为开发者提供了强大的工具支持。ROCm 7 提供了一系列新的功能和改进,旨在满足不断扩大的 AI 生态系统的需求。
新功能与优化
ROCm 7 的一大亮点是引入了最新的算法与模型,帮助开发者扩展 AI 的高级功能,促进更加高效的模型训练和推理。AMD 强调,ROCm 7 将进一步增强其在推理能力方面的优势,特别是对于诸如 vLLM v1、llm-d 和 SGLang 等新的机器学习模型的支持。这些新模型意味着开发者在处理不同类型的 AI 任务时,将拥有更多更强大的选择。
ROCm 7 中的集群管理和企业级功能的增强,将使得大规模计算资源的管理变得更加高效,开发者可以更好地利用硬件资源来完成复杂的 AI 任务。无论是针对科研机构,还是企业级应用,ROCm 7 都能提供灵活的解决方案,以应对不同领域的挑战。
对 MI350 系列的支持
AMD 在此次发布中也宣布,ROCm 7 将全面支持其最新的 MI350 系列加速卡,这一系列产品专为高性能计算和 AI 训练而设计。特别是针对 FP6 和 FP4 等高级数据类型的支持,意味着开发者能够在计算精度与性能之间找到更好的平衡,从而提升模型的计算效率。ROCm 7 还引入了对 FP8、FP6、FP4 及混合精度计算的支持,提供了更加灵活的计算选择。
在性能提升方面,ROCm 7 的表现也相当引人瞩目。例如,相较于 ROCm 6,使用 Llama 3.1 70B 模型时,性能提升了 3.2 倍,而使用 Qwen2-72B 时更是提升了 3.4 倍。这些显著的性能提升将极大地降低训练和推理模型所需的时间,使开发人员能够更快速地迭代和部署他们的 AI 应用。
未来展望
ROCm 7 的推出,是 AMD 一系列旨在提升 AI 开发与计算能力努力的有力证明。作为一家公司,AMD 正在全力以赴地推动开放计算的发展,使其不仅适用于 AI 领域的研究者和开发者,也能够服务于各行各业的企业需求。随着 ROCm 7 的落地,我们可以期待更多针对 AI 的创新应用将随之而来,特别是在医疗、金融、智能制造等领域。
随着开发者社区对 ROCm 的不断关注,AMD 还计划通过不断的更新和优化来进一步提升的功能性和易用性,以吸引更多的开发者加入到这个开放的中。开发者在享受强大硬件支持的同时,也将逐步获得更为成熟的软件工具和生态,从而能够专注于解决更加复杂的 AI 问题。
AMD 在 AI 领域的进展表明了其作为技术领导者的决心。随着 ROCm 7 的发布,AMD 的愿景不仅是提升计算性能,更重要的是为全球开发者提供更多的可能性,让 AI 技术能够在更广泛的应用场景中得到普及与发展。随着这一先进技术的普及,未来的 AI 将更加智能、高效,并引领新一轮的技术变革。