AMD Advancing AI 2025: ROCm 7 - Đòn bẩy cho sự sáng tạo AI
AMD đầu tư mạnh mẽ vào việc phát triển hệ sinh thái phần mềm mở, công bố phiên bản ROCm 7 tại sự kiện Advancing AI 2025.
Phần cứng hiệu năng cao chỉ là một nửa của câu chuyện thành công trong lĩnh vực AI, một nửa còn lại chính là phần mềm hỗ trợ. Nền tảng phần mềm đóng vai trò then chốt trong việc khai thác tối đa tiềm năng của phần cứng, đồng thời tạo ra môi trường phát triển thân thiện và hiệu quả cho các nhà phát triển. Radeon Open Compute platform hay ROCm chính là bằng chứng cho thấy AMD luôn chuẩn bị sẵn sàng cả mảng phần cứng lẫn lĩnh vực phần mềm, tập trung xây dựng hệ sính thái mở.
Nội dung bài viết
Những cải tiến hiệu năng trên AMD ROCm 7
ROCm 7 được AMD giới thiệu với những tuyên bố ấn tượng về hiệu năng. So với phiên bản ROCm 6, ROCm 7 mang lại khả năng suy luận (inference capability) cao hơn 3.5 lần và năng lực huấn luyện (training prowess) mạnh hơn 3 lần. Các thử nghiệm nội bộ của AMD cho thấy những cải thiện đáng kể trên các mô hình AI phổ biến. Chẳng hạn như, với mô hình Llama 3.1 70B, hiệu năng suy luận tăng 3.2 lần; với Qwen2-72B, con số này là 3.4 lần; trong khi với DeepSeek R1, hiệu năng tăng tới 3.8 lần so với khi sử dụng ROCm 6.
AMD nhấn mạnh rằng những bước nhảy vọt về hiệu năng này đến từ sự kết hợp của nhiều yếu tố, bao gồm việc cải thiện khả năng sử dụng của nền tảng, tối ưu hóa hiệu năng ở cấp độ thấp, hỗ trợ hiệu quả hơn cho các kiểu dữ liệu có độ chính xác thấp như FP4 và FP6. Ngoài ra, ROCm 7 cũng có những cải tiến trong các ngăn xếp giao tiếp (communication stacks) giúp tối ưu hóa việc sử dụng GPU và di chuyển dữ liệu giữa các thành phần hệ thống.
Tuy nhiên, cần lưu ý rằng việc so sánh hiệu năng với "ROCm 6" có thể AMD đang dựa trên phiên bản ROCm 6 tại thời điểm mô hình đó được hỗ trợ lần đầu tiên, chứ không nhất thiết là so sánh với phiên bản ROCm 6.4.1 ổn định mới nhất. Dù vậy, không thể phủ nhận rằng những cải tiến hiệu năng mà ROCm đạt được trong thời gian gần đây là rất đáng kể và đáng khích lệ.
Các tính năng và cập nhật của ROCm 7
ROCm 7 không chỉ tập trung vào hiệu năng mà còn mang đến hàng loạt tính năng và cập nhật quan trọng. Đầu tiên, ROCm 7 hỗ trợ các kiểu dữ liệu mới, tăng cường hỗ trợ cho các định dạng dữ liệu FP8, FP6, FP4 và tính toán với độ chính xác hỗn hợp (mixed precision). Đây là những yếu tố cực kỳ quan trọng để tối ưu hóa hiệu suất và giảm yêu cầu bộ nhớ cho các tác vụ suy luận AI hiện đại.
Một trong những điểm nhấn của ROCm 7 là cách tiếp cận mạnh mẽ và cởi mở đối với suy luận phân tán (Distributed Inference). AMD hợp tác chặt chẽ với cộng đồng mã nguồn mở và các framework phổ biến như SGLang, vLLM và llm-d để đồng phát triển các giao diện và thành phần cơ bản (primitives) dùng chung. Điều này cho phép các ứng dụng suy luận có thể mở rộng quy mô một cách hiệu quả trên nhiều GPU AMD.
ROCm 7 bổ sung các kernel tính toán mới và các thuật toán được tối ưu hóa, bao gồm tự động tinh chỉnh GEMM (General Matrix Multiply - phép nhân ma trận tổng quát), hỗ trợ cho các mô hình Mixture of Experts (MoE), các cơ chế chú ý (attention mechanisms) tiên tiến, cũng như một hệ thống cho phép các nhà phát triển tạo ra các kernel tùy chỉnh bằng ngôn ngữ Python.
Trải nghiệm của các nhà phát triển cũng được cải thiện với ROCm 7. Nền tảng này được thiết kế với mục tiêu đáp ứng nhu cầu ngày càng tăng của các ứng dụng Generative AI và HPC, đồng thời mang lại sự thay đổi tích cực trong trải nghiệm của nhà phát triển thông qua việc tăng cường khả năng tiếp cận, nâng cao hiệu quả làm việc và thúc đẩy sự hợp tác cộng đồng. ROCm 7 hỗ trợ tốt hơn cho các framework AI tiêu chuẩn công nghiệp như PyTorch và TensorFlow. Bên cạnh đó, ROCm 7 còn cung cấp các công cụ phát triển, trình điều khiển (driver), giao diện lập trình ứng dụng (API) và thư viện mới nhằm tăng tốc quá trình phát triển và triển khai các giải pháp AI.
Mở rộng hỗ trợ phần cứng và hệ điều hành
Một trong những thông báo quan trọng nhất trên sân khấu Advancing AI 2025 liên quan đến ROCm 7 là việc mở rộng đáng kể khả năng tương thích phần cứng và hỗ trợ hệ điều hành. AMD đang hiện thực hóa tầm nhìn "ROCm ở mọi nơi, cho mọi người" bằng cách mở rộng hỗ trợ ROCm ra ngoài các trung tâm dữ liệu. Các nhà phát triển sẽ sớm có thể xây dựng và chạy các ứng dụng AI trên các máy tính cá nhân sử dụng GPU Radeon và máy tính xách tay trang bị APU Ryzen AI. Điều này tạo ra môi trường phát triển nhất quán từ thiết bị đầu cuối (client) lên đến đám mây (cloud), dự kiến sẽ khả dụng rộng rãi từ nửa sau năm 2025.
Điểm nhấn đáng chú ý khác là ROCm 7 sẽ đưa Windows trở thành hệ điều hành được hỗ trợ đầy đủ và chính thức. Đây là một bước tiến mang tính chiến lược, bởi nó mở ra cánh cửa cho ROCm tiếp cận một lượng lớn các nhà phát triển và người dùng hiện đang làm việc chủ yếu trên môi trường Windows, đảm bảo tính di động của mã nguồn và hiệu quả trên cả các thiết lập cá nhân lẫn doanh nghiệp.
Có thể thấy, ROCm là vũ khí chiến lược của AMD trong cuộc chiến giành thị phần AI, đóng vai trò là đối trọng trực tiếp với nền tảng NVIDIA CUDA. Trong suốt nhiều năm, sự trưởng thành và phổ biến của CUDA là rào cản lớn cho các đối thủ cạnh tranh. Với ROCm 7, AMD đang cho thấy những nỗ lực nghiêm túc để thu hẹp khoảng cách này.
Chiến lược "ROCm everywhere for everyone" cùng với việc cung cấp các công cụ như tiện ích HIPIFY (giúp chuyển đổi mã nguồn từ CUDA sang ROCm một cách tương đối dễ dàng) là những bước đi quan trọng, nhằm khuyến khích các nhà phát triển khám phá và chuyển sang sử dụng nền tảng của AMD. Trước đây, điểm yếu về phần mềm thường được xem là một trong những hạn chế lớn nhất của AMD trên thị trường AI, nhưng với những cải tiến mạnh mẽ của ROCm 7, tình hình đang có những chuyển biến tích cực.
AMD Developer Cloud
AMD Developer Cloud ra mắt để hỗ trợ các nhà phát triển và thúc đẩy việc sử dụng nền tảng AI của hãng. Dịch vụ này cung cấp quyền truy cập ngay lập tức, không yêu cầu đầu tư phần cứng ban đầu, vào các GPU AMD Instinct MI300 (trong tương lai gần là MI350 Series), với các môi trường phát triển được cấu hình sẵn cùng các gói tín dụng (Developer Credits) sử dụng miễn phí. Các container Docker được cài đặt sẵn những phần mềm AI phổ biến giúp giảm thiểu đáng kể thời gian thiết lập ban đầu.
AMD Developer Cloud được kỳ vọng sẽ giúp giảm bớt rào cản gia nhập, mở rộng quyền truy cập vào năng lực tính toán AI thế hệ mới cho cộng đồng nhà phát triển toàn cầu, các dự án mã nguồn mở, đặc biệt là các cá nhân, startup hoặc tổ chức nghiên cứu có nguồn lực hạn chế. Đây không chỉ là một dịch vụ cung cấp tài nguyên tính toán, mà còn là một công cụ chiến lược để AMD thu thập phản hồi sớm từ người dùng, từ đó cải thiện sản phẩm và thúc đẩy việc chấp nhận rộng rãi hơn nền tảng ROCm và phần cứng Instinct.
Những bước tiến lớn của ROCm 7, đặc biệt là về hiệu năng và việc mở rộng hỗ trợ sang Windows cũng như các dòng GPU phổ thông Radeon, là yếu tố then chốt quyết định khả năng cạnh tranh dài hạn của AMD với NVIDIA trong lĩnh vực AI. Phần cứng mạnh mẽ là điều kiện cần, nhưng một hệ sinh thái phần mềm trưởng thành, dễ sử dụng, có hiệu năng cao và được cộng đồng ủng hộ rộng rãi mới là điều kiện đủ để giữ chân các nhà phát triển và người dùng. CUDA của NVIDIA có lợi thế đi trước rất lớn về mặt này. Tuy nhiên, nếu những cải tiến của ROCm 7 thực sự mang lại trải nghiệm tốt và hiệu năng cạnh tranh như đã công bố, kết hợp với lợi thế tiềm năng về giá/hiệu năng của phần cứng AMD, cán cân quyền lực trên thị trường phần mềm AI có thể bắt đầu thay đổi. Việc hỗ trợ Windows sẽ mở ra một thị trường người dùng và nhà phát triển khổng lồ mà trước đây ROCm gần như không thể tiếp cận.
Chiến lược "ROCm everywhere for everyone" và việc tích cực hỗ trợ các framework mã nguồn mở phổ biến (như vLLM, SGLang và sự hợp tác với Hugging Face) cho thấy AMD không chỉ cố gắng tự mình xây dựng mọi thứ, mà còn đang nỗ lực hình thành một "liên minh" gồm các nhà phát triển, công ty và tổ chức muốn có một giải pháp thay thế thực sự mở và mạnh mẽ cho nền tảng CUDA. Cách tiếp cận này không chỉ giúp tăng tốc độ phát triển và hoàn thiện ROCm mà còn tạo ra một hệ sinh thái đa dạng, linh hoạt hơn, thu hút những người ủng hộ triết lý nguồn mở và muốn tránh sự phụ thuộc vào một nhà cung cấp duy nhất.
