NVIDIA phát triển hệ thống cấp điện tới 1 MW cho máy chủ AI
Chuẩn bị cho một tương lai ngày càng ngốn điện và hơn thế nữa.
Sự lớn mạnh của AI đang ngày càng tốn kém nhiều tài nguyên hơn. Hiện tại một rack NVL72 GB200 và GB300 đã ngốn tới 132 kW - nhiều gấp đôi gấp ba lần một rack server phổ thông (50 - 80 kW). Và con số này sẽ không dừng ở đó khi muốn đạt năng lực xử lý cao hơn thì buộc con chip phải to bự hơn và đốt nhiều điện hơn. Đơn giản vì định luật Moore đã ở mức tới hạn và mật độ transistor không tăng được nhiều nữa. Nói cách khác, server của tương lai sẽ tốn nhiều điện hơn và AI sẽ đứng đầu trong cuộc chơi đó.
Để có thể tăng trưởng "an toàn" trong khoảng chục năm tới, ngoài việc chỉ sản xuất chip AI ra, NVIDIA cũng không thể bỏ qua việc làm sao cấp đủ điện cho chúng vận hành. Nếu lượng điện tiêu thụ của rack tăng tới 700 - 1000 kW dưới điện áp 54 V, nó sẽ cần khoảng không gian tương ứng với 64 máy chủ dạng U chỉ để chứa các thanh đồng (Cu), tương đương với 200 kg đồng/rack. Và nếu cần tới 1 GW điện thì lượng đồng cần thiết gần 500,000 m3!
Trước viễn cảnh đó, hãng chip AI này đề xuất mô hình cung cấp điện mới, sử dụng điện áp cao một chiều 800 V HDVC để thay thế hệ thống 54 V hiện tại. Cụ thể ở mô hình cũ, điện xoay chiều cao/trung thế từ mạng lưới được hạ thế xuống còn 415 V AC hoặc 480 V DC, rồi từ đây mới đi qua 200 kg Cu/rack nêu trên để vận hành cỗ máy. Nhưng ở mô hình 800 V HDVC, điện xoay chiều từ mạng lưới vừa được hạ thế, vừa được chuyển đổi tại chỗ sang 800 V DC, dòng điện mới có thể được dùng trực tiếp cho cỗ máy mà không cần tới PSU/USP như hiện tại.
NVIDIA cho biết với cách chuyển đổi trực tiếp này, lượng đồng dùng để tải điện cho cả hệ thống có thể giảm tới 45%, giúp cải thiện 5% hiệu quả tiêu thụ điện, cũng như giảm đáng kể chi phí để xây dựng hạ tầng (nhờ bớt lượng đồng cần dùng và không gian chứa). Chi phí bảo trì có thể giảm tới 70% vì không dùng PSU thì không có rủi ro hư hỏng PSU. Ngoài ra chi phí vận hành cũng giảm đi do không cần hệ thống làm mát cho các PSU trên trong từng rack.
Tuy vậy, NVIDIA không phải là hãng sản xuất thiết bị điện nên họ cần hợp tác với các đối tác chuyên ngành như Infineon, MPS, Navitas, ROHM, STMicroelectronics, Texas Instruments (cung cấp chip quản lý), Delta, Flex Power, Lead Wealth, LiteOn, Megmeet (cung cấp linh kiện điện), Eaton, Schneider Electric, Vertiv (cung cấp nguồn cho data center).
