Tham vọng chủ quyền số với siêu máy tính Exascale đầu tiên của Pháp
AMD và tập đoàn Eviden (thuộc Atos) công bố trúng thầu dự án xây dựng siêu máy tính Alice Recoque.
Alice Recoque là hệ thống đạt chuẩn Exascale (khả năng xử lý hơn 1 tỷ tỷ phép tính mỗi giây) đầu tiên được đặt tại Pháp, đồng thời là hệ thống thứ 2 tại Châu Âu, sau siêu máy tính Jupiter của Đức. Dự án có tổng trị giá 554 triệu Euro, gồm chi phí vận hành trong 5 năm, được tài trợ bởi liên doanh EuroHPC JU và tổ hợp Jules Verne (gồm Pháp, Hà Lan và Hy Lạp).
Siêu máy tính Alice Recoque dự kiến sẽ được lắp đặt tại Trung tâm Tính toán Quy mô lớn (TGCC - Très Grand Centre de Calcul) của Ủy ban Năng lượng Nguyên tử và Năng lượng Thay thế Pháp (CEA - Commissariat à l'Énergie Atomique et aux Énergies Alternatives), với kế hoạch khởi công xây dựng vào cuối năm 2026. Việc đặt tên hệ thống là "Alice Recoque" nhằm tri ân nữ khoa học gia máy tính tiên phong của Pháp, người đã có những đóng góp nền tảng cho kiến trúc máy tính và trí tuệ nhân tạo trong thế kỷ 20. Alice Recoque là bước đi chiến lược nhằm giảm sự phụ thuộc của Châu Âu vào công nghệ nước ngoài, đặc biệt trong bối cảnh cuộc đua AI toàn cầu đang tăng cao.
Nội dung bài viết
Kiến trúc phần cứng lai và bộ nhớ HBM4

Về mặt kỹ thuật, Alice Recoque được xây dựng dựa trên nền tảng BullSequana XH3500 mới nhất của Eviden, nổi bật với kiến trúc lai độc đáo kết hợp giữa công nghệ Mỹ và châu Âu. Sức mạnh tính toán chính đến từ các CPU AMD EPYC thế hệ kế tiếp (Venice) kết hợp cùng GPU AMD Instinct MI430X. Đây là 1 trong những hệ thống đầu tiên trên thế giới được xác nhận sẽ sử dụng chuẩn bộ nhớ HBM4, mang lại băng thông lên tới 19.6 TB/s cho mỗi GPU, giải quyết nút thắt cổ chai về dữ liệu trong các tác vụ huấn luyện mô hình ngôn ngữ lớn (LLM - Large Language Model).
Bên cạnh các CPU AMD, kiến trúc của Alice Recoque còn tích hợp phân vùng tính toán vô hướng sử dụng vi xử lý Rhea2 do SiPearl - công ty bán dẫn của Châu Âu - phát triển. Sự kết hợp này cho phép hệ thống tối ưu hóa cho cả các tác vụ mô phỏng khoa học truyền thống (HPC) lẫn các thuật toán trí tuệ nhân tạo hiện đại (AI), hỗ trợ đa dạng các định dạng dữ liệu tiên tiến như FP4 và FP8.

Điểm khác biệt lớn nhất của Alice Recoque so với các siêu máy tính sử dụng nền tảng NVIDIA là việc loại bỏ mạng InfiniBand để chuyển sang giải pháp kết nối BXIv3 (BullSequana eXascale Interconnect) do Eviden tự phát triển. Công nghệ này đóng vai trò như con đường huyết mạch, kết nối toàn bộ các thành phần tính toán và lưu trữ, giúp giảm thiểu độ trễ và tăng cường khả năng kiểm soát an ninh hạ tầng, đặc điểm quan trọng trong yêu cầu về chủ quyền công nghệ của Pháp.
Hiệu quả năng lượng và thiết kế tối ưu mật độ

Mặc dù sở hữu sức mạnh tính toán tương đương với 10 triệu máy tính để bàn hiện đại cộng lại, Alice Recoque được thiết kế để vận hành với mức tiêu thụ năng lượng tối ưu. Toàn bộ hệ thống chỉ gồm 94 tủ rack, ít hơn 25% so với các hệ thống Exascale cùng phân khúc, giúp tiết kiệm không gian sàn nhưng vẫn đảm bảo hiệu năng đỉnh đạt 1 Exaflop ở độ chính xác kép (double-precision HPC workload).
Để giải quyết vấn đề nhiệt lượng khổng lồ từ các GPU mật độ cao, Eviden áp dụng công nghệ làm mát trực tiếp bằng chất lỏng (Direct Liquid Cooling) thế hệ thứ 5. Cơ chế này sử dụng nước ấm để làm mát 100% các linh kiện trong tủ rack, loại bỏ nhu cầu sử dụng quạt vốn ồn ào và tiêu tốn điện năng. Nhờ đó, hiệu quả năng lượng trên mỗi GPU được cải thiện tới 50% so với các hệ thống hiện hành, đồng thời hiệu quả sử dụng năng lượng tổng thể (PUE) của các ứng dụng tăng khoảng 20%.
Tác động từ Alice Recoque

Nhà máy AI (AI Factory) Alice Recoque sẽ đóng vai trò trung tâm trong việc phát triển các mô hình nền tảng (foundation model) của châu Âu. Khả năng xử lý dữ liệu khổng lồ từ kính thiên văn, vệ tinh và các thiết bị IoT sẽ cho phép các nhà khoa học thực hiện các mô phỏng phức tạp về biến đổi khí hậu, vật liệu mới và y học cá thể hóa với tốc độ cực nhanh.
Dự án Alice Recoque cũng đánh dấu cam kết mạnh mẽ về chuỗi cung ứng nội khối, khi gần 75% linh kiện của nền tảng BullSequana XH3500 sẽ được sản xuất tại châu Âu, so với mức khoảng 50% của siêu máy tính Jupiter tại Đức. Điều này không chỉ giúp giảm thiểu rủi ro địa chính trị mà còn đảm bảo tuân thủ các quy định khắt khe về dữ liệu và môi trường của Liên minh Châu Âu.
Nhìn chung, sự ra đời của Alice Recoque vào năm 2027 (dự kiến vận hành đầy đủ) sẽ đặt Pháp và châu Âu vào vị thế đối trọng đáng kể trong bản đồ siêu máy tính thế giới, vốn đang bị chi phối bởi các gã khổng lồ công nghệ từ Mỹ. Sự kết hợp giữa phần cứng thế hệ mới của AMD và năng lực tích hợp hệ thống của Eviden hứa hẹn tạo ra công cụ nghiên cứu mạnh mẽ, phục vụ cho các thách thức khoa học và xã hội cấp bách trong thập kỷ tới.
