Benchmark chip server Xeon 6 - Nơi E-core toả sáng
Có vẻ môi trường máy chủ mới là "đất dụng võ" cho các nhân hiệu suất cao (efficent) của Intel thay vì những chiếc PC lẻ tẻ.
Bạn có đang làm việc đúng chuyên ngành không? Câu hỏi này có thể sẽ làm nhiều người "bị nhột" nhưng nó là điều đã/đang diễn ra với E-core của Intel bao lâu nay. Có lẽ bạn đã từng học làm kỹ sư, thiết kế, quản trị kinh doanh... nhưng dòng đời đưa đẩy bạn về đâu đó làm telesale, shipper. Bạn có lẽ đã từng học làm bánh kiểu tây nhưng run rủi thế nào bạn lại đang phụ bếp trong một nhà hàng - cũng là làm đồ ăn cho khách nhưng sao nó lạ lắm...
Quay lại chủ đề chính, mới đây tại Computex, Intel vừa trình làng lứa chip Xeon đầu tiên dựa trên E-core, có tên mã Sierra Forest, còn tên thương mại là Xeon 6700E. Sierra Forest có cấu hình tối đa 144 nhân, được định hướng nhắm đến các datacenter, dịch vụ đám mây hoặc những nơi không đòi hỏi hiệu năng mà chủ yếu là tiết kiệm điện. Phoronix, một trong số chuyên trang về server Linux, đã có dịp benchmark 2 model đại diện Xeon 6780E và 6766E, cho chúng ta được cái nhìn khác về E-core.
Danh sách chip EPYC và Xeon được dùng benchmark
Trước hết, hãy điểm qua hệ thống testbed của Phoronix. Do Intel định hướng Sierra Forest sẽ thay thế cả những hệ thống server đã bắt đầu "có tuổi", nên danh sách này có thêm cả Cooper Lake, một đại diện 14 nm từ 4 năm trước. Tất nhiên thời điểm đó chưa đó DDR5 nên tester cũng chỉ có thể dùng cấu hình RAM tối đa mà các hệ thống có thể hỗ trợ. Bạn cũng cần chú ý phía AMD có 2 đại diện Siena (Zen 4c) vốn chỉ hỗ trợ cấu hình 1P (1 socket) nên không có kết quả 2P như các hệ thống còn lại. Nhưng bạn vẫn có thể dùng để đối chiếu với hệ thống Sierra Forest 1P để có so sánh tương đối giữa Zen 4c vs. E-core Crestmont (tuy số nhân khác nhau nhưng thực tế khi mua chip là bạn mua cả con chip, không phải mua từng nhân về lắp LEGO).
Hệ thống test Sierra Forest (Xeon 6700E) với 2 socket
Ngoại trừ khác biệt về CPU, RAM và mainboard, phần còn lại của testbed giống nhau - Ubuntu 24.04 (Linux 6.9, compiler GCC 13), ổ SSD KIOXIA KCD8XPUG1T92 PCIe 5.0. Các hệ thống Sapphire Rapids kèm HBM (Xeon Max) được chạy ở chế độ mặc định vì một số phép thử không đủ dung lượng bộ nhớ khi chỉ chạy với HBM. Ngoài ra, trên server ngoài sức mạnh ra, một yếu tố đôi khi quan trọng hơn cả chính là mức tiêu thụ điện. Do các datacenter có từ hàng chục, hàng trăm, thậm chí hàng ngàn CPU, hoá đơn tiền điện là vấn đề cực lớn khi tính toán chi phí đầu tư hệ thống. Vì vậy hầu hết mọi phép thử của Phoronix đều kèm theo mức tiêu thụ năng lượng.
Vì số lượng benchmark của Phoronix rất nhiều, nên mình chỉ trích lại một vài kết quả. Phần còn lại nếu có quan tâm, bạn có thể tự tham khảo (rất đáng đọc nếu bạn làm IT). Mình đi nhanh qua phần kết luận sau.
Một số kết quả benchmark gồm hiệu năng và mức tiêu thụ điện
Một điều rõ ràng có thể thấy là Sierra Forest chỉ có E-core, nên chắc chắn nó sẽ không mạnh mẽ. Nhưng bù lại Sierra Forest có số lượng (tương tự Zen 4c của AMD). Nên ở khối lượng công việc nào được tối ưu cho đa luồng thì Sierra Forest tỏ ra rất có ưu thế, thậm chí trội hơn cả Emerald Rapids (P-core). Dĩ nhiên Cooper Lake "không có cửa" ở đây vì số nhân mà nó sở hữu rất ít (28 nhân, 56 luồng). Chi tiết đáng chú ý là các model Rapids tuy có SMT cho tổng luồng xử lý cũng không quá thua kém Sierra Forest, nhưng hiệu quả thực tế đôi khi "thua tệ" vì nhân ảo dù sao vẫn không bằng nhân thực!
Về phía AMD mọi thứ cũng tương tự, thậm chí là có phần thú vị hơn. Bạn có thể đã biết Zen 4c chỉ là bản cắt giảm cache so với Zen 4, không quá chênh lệch như E-core vs. P-core. Và trên server, việc đặt xung cao là cực khó khi bạn phải chia nguồn điện/tản nhiệt cho vài chục, vài trăm nhân cùng lúc. Nếu như PC các hãng tha hồ "múa" với những con chip 5-6 GHz, thì trên server, rất hiếm khi chúng lên được 4 GHz. Phần lớn thời gian, nhất là khi xử lý đa luồng, xung chip server chỉ loanh quanh 3 GHz hoặc thấp hơn. Do đó lợi thế của Zen 4 vs. 4c gần như biến mất trong môi trường này (trừ phép thử nào nặng L3 Cache thì mới thể hiện rõ). Đây là lý do tại sao có nhiều kết quả con chip Bergamo thể hiện tốt hơn cả Genoa-X.
Tổng kết benchmark của Phoronix, Sierra Forest thậm chí tốt hơn cả Emerald Rapids
Các chip Sierra Forest 144 nhân chỉ "hao điện" hơn chip Siena 64 nhân!
Và kết hợp 2 phe xanh đỏ lại, chúng ta có một... nồi thập cẩm! Có phép thử Bergamo tốt hơn, có phép thử Sierra Forest nhỉnh hơn, lại cũng có phép thử AMD thắng chặt. Nhưng điều cần nhớ ở đây là, Sierra Forest được kỳ vọng cắt giảm chi phí điện năng, hơn là thắng về sức mạnh. Theo ghi nhận của Phoronix, 1 nhân của Xeon 6766E tiêu thụ trung bình 0,98 W (tối đa 1,88 W), còn 1 nhân của Xeon 6780E trung bình dùng hết 1,17 W (tối đa 2,47 W). Con số này bên EPYC 9754 là 1,75 W (tối đa 3,1 W). Còn Xeon Platinum 8592+ lên tới 4 W (tối đa 6,3 W). Tất nhiên, điều này có được một phần nhờ vào việc Xeon 6700E được sản xuất trên dây chuyền Intel 3, tốt hơn nhiều Intel 7.
Nhìn chung khi chạy cấu hình 2 chip, Xeon 6780E tiêu thụ điện ít hơn EPYC 9754 15%. Còn khi chạy solo, Xeon 6780E chỉ hao bằng 2/3 EPYC 9754. Tổng kết lại, mọi thứ dường như khá khôi hài khi 2 đại diện Granite Rapids và Emerald Rapids (đều P-core) vừa ra mắt năm ngoái lại không gây được mấy ấn tượng. Trong khi Sierra Forest được xem là sản phẩm thứ cấp (E-core) vốn mang tiếng "black sheep of the family" lại cho kết quả vượt mong đợi.
Với kết quả này của Sierra Forest, các đối thủ ARM hãy lo mà nhìn lại mình trước khi muốn lấn sân vào mảng server.
Theo Phoronix

1 thought on “Benchmark chip server Xeon 6 - Nơi E-core toả sáng”