Tại sao NVIDIA ví trí tuệ nhân tạo như là "cái bánh 5 lớp"?
Chiến lược "cái bánh 5 lớp" (5-layer cake) về trí tuệ nhân tạo giúp NVIDIA trở thành thế lực dẫn dắt toàn bộ hệ sinh thái AI toàn cầu.
Cấu trúc 5 lớp gồm nguồn năng lượng vật lý, chip xử lý, hạ tầng siêu nhà máy, cho đến các mô hình và ứng dụng thực tiễn. Máy học đang thay thế mô hình phần mềm rập khuôn truyền thống để chuyển sang khả năng suy luận theo thời gian thực. Với hàng nghìn tỷ USD đang được rót vào quá trình xây dựng trung tâm dữ liệu, đây là đợt nâng cấp hạ tầng vật lý lớn nhứt trong lịch sử nhân loại.
- Hệ sinh thái trí tuệ nhân tạo được NVIDIA hệ thống hóa thành mô hình 5 lớp: Năng lượng (Energy), Vi mạch (Chips), Hạ tầng (Infrastructure), Mô hình (Models) và Ứng dụng (Applications).
- Công nghệ máy học đang chuyển từ truy xuất dữ liệu phần mềm có sẵn sang khả năng tạo ra trí thông minh theo thời gian thực dựa trên bối cảnh.
- Các siêu nhà máy AI đang tạo ra cơn khát nhân lực tay nghề cao như thợ điện, thợ sửa ống nước và kỹ sư mạng, thay vì chỉ tập trung vào giới lập trình.
- Tập đoàn tài chính Morgan Stanley dự báo quy mô xây dựng hạ tầng trung tâm dữ liệu toàn cầu sẽ tiêu tốn chừng 2.9 nghìn tỷ USD từ nay cho tới năm 2028.
- Những mô hình nguồn mở như DeepSeek-R1 đóng vai trò xúc tác, đẩy nhanh tốc độ ứng dụng và tăng áp lực lên các giới hạn phần cứng và năng lượng.
Nội dung bài viết
Định hình lại bản chất của công nghệ máy học
Trong suốt chiều dài lịch sử của ngành khoa học máy tính, phần mềm chủ yếu tồn tại dưới dạng các tập lệnh được viết sẵn: con người thiết lập thuật toán và máy móc chỉ việc thực thi rập khuôn. Các cơ sở dữ liệu cần phải được cấu trúc hóa nghiêm ngặt, lưu trữ gọn gàng trong các bảng biểu và chỉ có thể được trích xuất bằng những câu lệnh truy vấn SQL chính xác. Tuy nhiên, trí tuệ nhân tạo giờ đây đã phá vỡ truyền thống này, có khả năng hiểu các luồng thông tin phi cấu trúc như hình ảnh, âm thanh và văn bản thô. Điểm chính của sự thay đổi là việc hệ thống không còn rà tìm các chỉ thị được lập trình sẵn, mà chuyển qua khả năng suy luận bối cảnh, tự động sản sinh ra trí thông minh theo thời gian thực.
Toàn bộ computing stack bên dưới đã được hệ thống hóa thành cấu trúc "cái bánh 5 lớp" mang tính công nghiệp. Nằm ở vị trí sâu nhứt và đóng vai trò làm nền móng tuyệt đối chính là lớp năng lượng (Energy). Do AI được sản xuất theo thời gian thực, nó cần nguồn cung cấp điện năng cũng phải được tạo ra và đáp ứng tức thời. Từng token sinh ra đều là kết quả của quá trình dịch chuyển điện tử, quản lý nhiệt lượng và biến đổi điện năng thành các phép tính toán học phức tạp. Tại phân lớp này, hoàn toàn không tồn tại bất kỳ lớp trừu tượng phần mềm nào che chắn, biến năng lượng thành ràng buộc vật lý cứng rắn nhứt quyết định quy mô sản lượng trí thông minh mà hệ thống có thể cung cấp.
Nằm ngay trên lớp năng lượng là phân lớp vi mạch (Chips) - nơi của những vi xử lý chuyên dụng được thiết kế nhằm chuyển hóa dòng điện thành sức mạnh tính toán với hiệu năng cực lớn. Khác hoàn toàn với chip máy tính cá nhân truyền thống, khối lượng công việc của AI cần khả năng xử lý song song ở quy mô lớn, bộ nhớ băng thông rộng và các cổng kết nối nội bộ có tốc độ truyền tải siêu nhanh. Tốc độ tiến hóa ở lớp Chips này đóng vai trò như bánh răng định chuẩn, quyết định trực tiếp đến tốc độ mở rộng quy mô của toàn bộ hệ sinh thái máy học. Bên cạnh đó còn tác động lên bài toán chi phí để làm cho AI trở nên dễ tiếp cận hơn đối với đại đa số doanh nghiệp.
Sự bùng nổ của các siêu nhà máy AI
Phân lớp thứ 3 trong hệ sinh thái là hạ tầng vật lý (Infrastructure), gồm toàn bộ các yếu tố từ quỹ đất, trạm phân phối điện, hệ thống làm mát bằng chất lỏng, cáp quang mạng lưới cho tới khâu thi công xây dựng. Đây là tập hợp những hệ thống cơ khí và điện tử phức tạp nhằm điều phối 10,000 bộ vi xử lý hoạt động đồng bộ như 1 cỗ máy thống nhứt. Các cơ sở này không được thiết kế để làm kho lưu trữ thông tin kỹ thuật số theo cách hiểu về trung tâm dữ liệu kiểu cũ, mà chúng thực sự là những siêu nhà máy AI chuyên biệt, có nhiệm vụ sản xuất trí thông minh ở quy mô công nghiệp.
Việc tạo nên phân lớp hạ tầng này đang kích hoạt cuộc đua xây dựng vật lý có quy mô lớn nhứt trong lịch sử nhân loại, vượt xa khỏi các giới hạn của những trung tâm công nghệ kiểu cũ. Theo các dữ liệu nghiên cứu thị trường từ tập đoàn tài chính Morgan Stanley công bố trong năm 2026, tổng chi phí đầu tư cho việc xây dựng trung tâm dữ liệu trên toàn cầu dự kiến sẽ chạm ngưỡng 2.9 nghìn tỷ USD tính đến năm 2028. Cơn khát hạ tầng này cần có lực lượng lao động khổng lồ và lành nghề, từ các thợ điện bậc thầy, thợ lắp ráp đường ống, công nhân thép cho đến kỹ sư viễn thông. Những công việc này đang rơi vào tình trạng thiếu hụt nguồn cung trầm trọng và được trả lương rất hậu hĩnh, cho thấy người lao động hoàn toàn không cần tới bằng tiến sĩ khoa học máy tính cũng có thể hưởng lợi từ cuộc cách mạng công nghệ này.
Models và Applications
Nằm trên bề mặt của các siêu nhà máy AI là lớp thứ 4: các mô hình trí tuệ nhân tạo (Models). Sự tiến bộ của các mô hình này không chỉ giới hạn ở khả năng xử lý ngôn ngữ tự nhiên, mà đã lan rộng ra khả năng hiểu sinh học, hóa học, vật lý học, tài chính, y khoa, cũng như mô phỏng các quy luật vật lý của thế giới thực. Những bước đột phá mang tính nền tảng nhứt đang diễn ra trong lĩnh vực máy học dự đoán cấu trúc protein, trí tuệ nhân tạo hóa học, hệ thống robot tự hành và các trình mô phỏng không gian. Những mô hình nguồn mở đang có vai trò cực kỳ quan trọng khi hầu hết các nền tảng trên thế giới đều được phân phối miễn phí, giúp giới nghiên cứu, các công ty khởi nghiệp và cả các quốc gia đang phát triển dễ dàng chen chân vào chuỗi cung ứng máy học.
Ví dụ điển hình cho sức mạnh của mã nguồn mở là sự xuất hiện của mô hình DeepSeek-R1. Đây là mô hình suy luận vượt trội và mở mã nguồn rộng rãi, làm thay đổi cục diện phần mềm và kích hoạt làn sóng nhu cầu khổng lồ kéo dọc xuống toàn bộ các phân lớp bên dưới. Khi mô hình nguồn mở đạt tới ranh giới của sự hoàn thiện, nó trực tiếp thúc đẩy quá trình áp dụng tại lớp ứng dụng, đồng thời tăng áp lực lên năng lực huấn luyện, đòi hỏi các siêu nhà máy hạ tầng phải trang bị thêm chip và đốt thêm nhiều năng lượng điện hơn nữa. Kiến trúc Mixture of Experts của DeepSeek-R1 sở hữu 671 tỷ tham số nhưng chỉ kích hoạt chừng 37 tỷ tham số cho mỗi lượt suy luận, giúp hệ thống hoạt động trơn tru trong khi tối ưu hóa chi phí phần cứng cực kỳ tốt.
Lớp trên cùng của hệ sinh thái, nơi trực tiếp tạo ra dòng tiền và giá trị thặng dư cho nền kinh tế, chính là các ứng dụng (Applications). Từ các nền tảng phát minh dược phẩm sinh học, trợ lý pháp lý ảo, robot công nghiệp cho tới xe tự lái, tất cả đều chia sẻ chung cấu trúc 5 lớp bên dưới nhưng lại cho ra những kết quả thương mại hoàn toàn khác biệt. Một chiếc xe tự lái bản chất là ứng dụng máy học hiện thân bên trong cỗ máy cơ khí, trong khi robot hình người lại là sự kết hợp của phần mềm bên trong kết cấu mô phỏng sinh học.
Lực kéo vĩ mô và sự cộng hưởng của thời đại mới
Trái với những lo ngại về việc máy móc sẽ cướp đi sinh kế của con người, sự bùng nổ của các ứng dụng này đang thúc đẩy năng suất ở quy mô chưa từng có trong nền kinh tế tri thức. Lấy ví dụ trong lĩnh vực chẩn đoán hình ảnh y khoa, dù máy tính đã có khả năng phụ giúp đọc các bản chụp chiếu, nhu cầu tuyển dụng bác sĩ hình ảnh vẫn tiếp tục tăng trưởng mạnh. Điều này không hề mâu thuẫn, vì mục đích tối thượng của y bác sĩ là chăm sóc bệnh nhân; khi máy móc đảm nhiệm phần việc phân tích phim chụp theo kiểu rập khuôn, các chuyên gia có dư dả thời gian để tập trung vào đưa ra phán đoán y khoa, giao tiếp và điều trị. Năng suất cao hơn tạo ra năng lực dư thừa, từ đó giúp các bệnh viện tiếp nhận nhiều bệnh nhân hơn, bổ sung nhiều nhân sự hơn và kéo theo sự tăng trưởng vĩ mô.
Nhìn chung, kiến trúc "5-layer cake" này hoạt động theo nguyên lý cộng hưởng, từng lớp đều gia cố và bổ sung sức mạnh cho những lớp còn lại. Các nhà máy máy học liên tục mọc lên do trí thông minh nay đã có thể sinh ra theo thời gian thực; bộ vi xử lý liên tục được nâng cấp vì hiệu quả điện năng sẽ định đoạt tốc độ mở rộng; năng lượng trở thành điểm nghẽn quan trọng định hình trần giới hạn của hiệu năng tính toán; còn ứng dụng bùng nổ khi các mô hình đã vượt qua ngưỡng chất lượng và mang lại sự hữu ích ở quy mô lớn. Hiện tại, chúng ta vẫn đang ở những chương đầu tiên của cuộc chuyển giao này, phần lớn hạ tầng vật lý vẫn chưa thành hình, trong khi nhân lực chưa được đào tạo đầy đủ. Tốc độ xây dựng cũng như khả năng kiểm soát trách nhiệm của nhân loại sẽ định hình đầy đủ hình hài của kỷ nguyên sắp tới.
Mô hình 5 lớp của NVIDIA cho thấy phần cứng và hạ tầng vật lý vẫn là rào cản cao nhất cho sự phát triển của công nghệ máy học trong thập kỷ tới. Những đột phá từ các mô hình nguồn mở như DeepSeek-R1 đã cho thấy rằng phần mềm có thể được tối ưu hóa cực tốt (chỉ xài 37 tỷ tham số kích hoạt trên tổng số 671 tỷ), nhưng chung quy lại thì nhu cầu sức mạnh phần cứng vẫn sẽ bị đẩy lên đỉnh điểm. Bất kỳ ai làm trong ngành kỹ thuật phần cứng, quản trị mạng hay thiết kế hạ tầng trung tâm dữ liệu đều nên tranh thủ bổ sung kiến thức về máy chủ xử lý song song, giải pháp tản nhiệt lỏng và quản trị mạng băng thông cao. Đây sẽ là những mỏ vàng tuyển dụng cực kỳ khát nhân lực tại thị trường nội địa trong những năm sắp tới.
