AMD 发布 ROCm 7，加速 AI 开发与计算能力提升

时间：2025-07-13 19:40

小编：星品数码网

在全球技术领域，人工智能（AI）的迅猛发展正引发一场新的技术革命。作为业界领先的半导体公司，AMD（超微半导体）在 AI 计算领域的投入一直备受关注。近期，AMD 在其 Advancing AI 2025 活动上正式发布了 ROCm 7，这一全新版本的软件栈旨在进一步增强开发者的生产力，并加速 AI 的应用和部署。ROCm 7 的发布标志着 AMD 在支持 AI 加速计算方面迈出了重要的一步，尤其是在提升深度学习模型的性能和效率方面。

ROCm（Radeon Open Compute）是 AMD 专为数据中心和高性能计算（HPC）设计的开放计算。随着 AI 需求的日益增长，ROCm 软件栈得到了不断的更新与优化，为开发者提供了强大的工具支持。ROCm 7 提供了一系列新的功能和改进，旨在满足不断扩大的 AI 生态系统的需求。

新功能与优化

ROCm 7 的一大亮点是引入了最新的算法与模型，帮助开发者扩展 AI 的高级功能，促进更加高效的模型训练和推理。AMD 强调，ROCm 7 将进一步增强其在推理能力方面的优势，特别是对于诸如 vLLM v1、llm-d 和 SGLang 等新的机器学习模型的支持。这些新模型意味着开发者在处理不同类型的 AI 任务时，将拥有更多更强大的选择。

ROCm 7 中的集群管理和企业级功能的增强，将使得大规模计算资源的管理变得更加高效，开发者可以更好地利用硬件资源来完成复杂的 AI 任务。无论是针对科研机构，还是企业级应用，ROCm 7 都能提供灵活的解决方案，以应对不同领域的挑战。

对 MI350 系列的支持

AMD 在此次发布中也宣布，ROCm 7 将全面支持其最新的 MI350 系列加速卡，这一系列产品专为高性能计算和 AI 训练而设计。特别是针对 FP6 和 FP4 等高级数据类型的支持，意味着开发者能够在计算精度与性能之间找到更好的平衡，从而提升模型的计算效率。ROCm 7 还引入了对 FP8、FP6、FP4 及混合精度计算的支持，提供了更加灵活的计算选择。

在性能提升方面，ROCm 7 的表现也相当引人瞩目。例如，相较于 ROCm 6，使用 Llama 3.1 70B 模型时，性能提升了 3.2 倍，而使用 Qwen2-72B 时更是提升了 3.4 倍。这些显著的性能提升将极大地降低训练和推理模型所需的时间，使开发人员能够更快速地迭代和部署他们的 AI 应用。

未来展望

ROCm 7 的推出，是 AMD 一系列旨在提升 AI 开发与计算能力努力的有力证明。作为一家公司，AMD 正在全力以赴地推动开放计算的发展，使其不仅适用于 AI 领域的研究者和开发者，也能够服务于各行各业的企业需求。随着 ROCm 7 的落地，我们可以期待更多针对 AI 的创新应用将随之而来，特别是在医疗、金融、智能制造等领域。

随着开发者社区对 ROCm 的不断关注，AMD 还计划通过不断的更新和优化来进一步提升的功能性和易用性，以吸引更多的开发者加入到这个开放的中。开发者在享受强大硬件支持的同时，也将逐步获得更为成熟的软件工具和生态，从而能够专注于解决更加复杂的 AI 问题。

AMD 在 AI 领域的进展表明了其作为技术领导者的决心。随着 ROCm 7 的发布，AMD 的愿景不仅是提升计算性能，更重要的是为全球开发者提供更多的可能性，让 AI 技术能够在更广泛的应用场景中得到普及与发展。随着这一先进技术的普及，未来的 AI 将更加智能、高效，并引领新一轮的技术变革。

AMD 发布 ROCm 7，加速 AI 开发与计算能力提升

精品推荐

相关文章