AMD 推进 AI 2025:ROCm 7 – 利用 AI 创新
AMD 大力投资开发开放软件生态系统,并在 Advancing AI 2025 活动上发布了 ROCm 版本 7。
高性能硬件只是 AI 成功的一半,另一半则在于配套的软件。软件平台在最大限度地发挥硬件潜力的同时,也为开发者打造友好高效的开发环境,发挥着关键作用。Radeon 开放计算平台(ROCm)证明了 AMD 在硬件和软件方面始终准备就绪,并专注于构建开放的生态系统。
文章内容
AMD ROCm 7 的性能改进
AMD 推出了性能强劲的 ROCm 7。与 ROCm 6 相比,ROCm 7 的推理能力提升了 3.5 倍,训练能力也提升了 3 倍。AMD 的内部测试表明,主流 AI 模型的性能得到了显著提升。例如,使用 Llama 3.1 70B 模型,推理性能提升了 3.2 倍;使用 Qwen2-72B 模型,推理性能提升了 3.4 倍;而使用 DeepSeek R1 模型,与使用 ROCm 6 相比,性能提升了 3.8 倍。
AMD 指出,这些性能飞跃源于多种因素,包括平台可用性的提升、底层性能优化以及对 FP4 和 FP6 等低精度数据类型的更好支持。ROCm 7 还改进了通信堆栈,从而优化了 GPU 利用率和系统组件之间的数据移动。
不过,需要注意的是,与“ROCm 6”的性能比较可能是 AMD 针对该型号首次支持时的 ROCm 6 版本进行的,不一定是最新的稳定版本 ROCm 6.4.1。然而,不可否认的是,ROCm 近年来取得的性能提升是显著且令人鼓舞的。
ROCm 7 功能和更新
ROCm 7 不仅注重性能,还带来了许多重要的功能和更新。首先,ROCm 7 支持新的数据类型,增强了对 FP8、FP6、FP4 数据格式以及混合精度计算的支持。这些对于优化性能并降低现代 AI 推理任务的内存需求至关重要。
ROCm 7 的一大亮点在于其强大且开放的分布式推理方法。AMD 与开源社区以及 SGLang、vLLM 和 llm-d 等热门框架密切合作,共同开发通用接口和原语。这使得推理应用程序能够在多个 AMD GPU 之间高效扩展。
ROCm 7 增加了新的计算内核和优化算法,包括 GEMM(通用矩阵乘法)自动调整、对混合专家(MoE)模型的支持、高级注意力机制以及允许开发人员在 Python 中创建自定义内核的系统。
ROCm 7 也提升了开发者体验。该平台旨在满足生成式 AI 和 HPC 应用日益增长的需求,同时通过提升可访问性、提高生产力和促进社区协作来彻底改变开发者体验。ROCm 7 为 PyTorch 和 TensorFlow 等行业标准 AI 框架提供了更强大的支持。此外,ROCm 7 还提供全新的开发工具、驱动程序、应用程序编程接口 (API) 和库,以加速 AI 解决方案的开发和部署。
扩展硬件和操作系统支持
在“推进人工智能 2025”峰会上,与 ROCm 7 相关的最重要的公告之一是显著扩展了硬件兼容性和操作系统支持。AMD 正在通过将 ROCm 支持扩展到数据中心之外,实现其“ROCm 无处不在,人人共享”的愿景。开发者很快就能在搭载 Radeon GPU 的 PC 和搭载 Ryzen AI APU 的笔记本电脑上构建和运行 AI 应用程序。这将创建一个从客户端到云端的一致开发环境,预计将于 2025 年下半年广泛普及。
另一个值得注意的亮点是,ROCm 7 将使 Windows 成为一款获得官方全面支持的操作系统。这是一个战略举措,因为它为 ROCm 打开了大门,使其能够接触到目前主要在 Windows 环境中工作的大量开发人员和用户,确保源代码在个人和企业设置中的可移植性和效率。
可以看出,ROCm 是 AMD 在 AI 市场份额争夺战中的战略利器,直接制衡了 NVIDIA CUDA 平台。多年来,CUDA 的成熟度和普及度一直是竞争对手面临的一大障碍。凭借 ROCm 7,AMD 正积极努力缩小这一差距。
“ROCm 无处不在,人人共享”战略,以及提供 HIPIFY 实用程序(这使得将源代码从 CUDA 转换为 ROCm 变得相对容易)等工具,是鼓励开发人员探索并迁移到 AMD 平台的重要举措。长期以来,软件缺陷一直被认为是 AMD 在 AI 市场上最大的限制之一,但随着 ROCm 7 的强劲改进,情况正在发生积极变化。
AMD 开发者云
AMD 开发者云旨在支持开发者,加速公司 AI 平台的普及。该服务无需任何初始硬件投资,即可立即访问 AMD Instinct MI300(即将推出 MI350 系列)GPU、预配置的开发环境以及免费的开发者积分。预装常用 AI 软件的 Docker 容器可显著缩短初始设置时间。
AMD 开发者云有望帮助降低进入门槛,扩大全球开发者社区、开源项目,尤其是资源有限的个人、初创企业或研究机构获取下一代 AI 计算能力的渠道。这不仅是一项提供计算资源的服务,也是 AMD 收集用户早期反馈的战略工具,从而改进产品并推动 ROCm 平台和 Instinct 硬件的更广泛应用。
ROCm 7 的重大改进,尤其是在性能以及扩展对 Windows 和主流 Radeon GPU 的支持方面,是 AMD 在 AI 领域与 NVIDIA 保持长期竞争力的关键。强大的硬件固然重要,但成熟、易用、高性能且得到广泛支持的软件生态系统足以让开发者和用户保持参与。NVIDIA 的 CUDA 在这方面拥有巨大的领先优势。然而,如果 ROCm 7 的改进真的能带来承诺的竞争性能和体验,再加上 AMD 硬件潜在的性价比优势,AI 软件市场的力量平衡可能会开始发生转变。Windows 支持将打开一个巨大的用户和开发者市场,而此前 ROCm 基本上无法触及这个市场。
“ROCm 无处不在,人人共享”的战略以及对热门开源框架(例如 vLLM、SGLang 以及与 Hugging Face 的合作)的积极支持表明,AMD 不仅试图自主构建一切,而且还致力于组建一个由开发者、公司和组织组成的“联盟”,他们渴望找到一个真正开放且强大的 CUDA 平台替代方案。这种方法不仅加速了 ROCm 的开发和成熟,而且还创建了一个更加多样化和灵活的生态系统,吸引了那些支持开源理念并希望避免被单一供应商束缚的人们。

1 thought on “AMD 推进 AI 2025:ROCm 7 – 利用 AI 创新”