⚡ NVIDIA Vera Rubin chính thức sản xuất: 50 PFLOPS, 288GB HBM4, rẻ hơn 10 lần

⚡ NVIDIA Vera Rubin chính thức sản xuất: 50 PFLOPS, 288GB HBM4, rẻ hơn 10 lần

Jensen Huang vừa thả "bom tấn" tại GTC tháng 4/2026: nền tảng Vera Rubin đã chính thức bước vào sản xuất hàng loạt, khép lại kỷ nguyên Blackwell chỉ sau hơn một năm.

Đây không còn là một con GPU đơn lẻ, mà là cả một hệ sinh thái 7 con chip được NVIDIA tích hợp dọc từ A đến Z. Và điều khiến cả ngành AI rúng động chính là con số: chi phí inference giảm tới 10 lần.

🚀 Thông số kỹ thuật khiến Blackwell trở nên lỗi thời

Rubin GPU sở hữu 336 tỷ transistor, đi kèm 288GB bộ nhớ HBM4 với băng thông 22 TB/s, tức gấp 2.8 lần so với Blackwell (chỉ 8 TB/s).

Sức mạnh tính toán cũng nhảy vọt không kém. Rubin đạt 50 PFLOPS NVFP4 cho inference (gấp 5 lần Blackwell) và 35 PFLOPS NVFP4 cho training (gấp 3.5 lần). Riêng tủ rack Vera Rubin NVL72 cho tổng băng thông NVLink lên tới 260 TB/s, đủ sức cân các mô hình MoE quy mô nghìn tỷ tham số mà Blackwell phải "thở dốc".

🧩 Bộ 7 chip thay đổi luật chơi hạ tầng AI

Lần đầu tiên NVIDIA tung ra cùng lúc một dàn 7 con chip ăn khớp với nhau, gồm: Vera CPU (thay thế Grace), Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPUSpectrum-6 Ethernet switch.

Triết lý ở đây rất rõ: thay vì bán GPU rời, NVIDIA bán nguyên một data center "đóng hộp". Khách hàng cắm điện vào là chạy được, không cần ghép nối thiết bị từ chục nhà cung cấp khác nhau. Đây là bước nhảy từ kiến trúc thuần GPU sang một hệ thống tích hợp dọc hoàn chỉnh.

💰 Cú đấm kinh tế: rẻ hơn 10 lần, ít GPU hơn 4 lần

Đây mới là điểm nhấn thực sự. Rubin giảm chi phí token inference tới 10 lần và giảm số lượng GPU cần để train mô hình MoE đi 4 lần so với Blackwell.

Dịch ra ngôn ngữ thực tế: một startup AI có thể chạy cùng workload chỉ với một phần tư hạ tầng cũ. Nghĩa là hóa đơn điện giảm, tiền thuê data center giảm, vốn đầu tư ban đầu giảm. Với các công ty đang đốt tiền cho inference như ChatGPT hay Claude, đây là phép màu kế toán.

🤝 Đơn hàng nổ tung: Meta chi 12 tỷ USD cho Rubin

Nhu cầu bùng nổ ngay lập tức sau công bố. Nebius Group ký hợp đồng hạ tầng 27 tỷ USD với Meta, trong đó 12 tỷ USD dành riêng cho dung lượng Vera Rubin.

Lịch giao hàng đã được chốt: khách hàng đầu tiên sẽ nhận máy trong nửa cuối 2026. Với mức giá Blackwell hiện tại đang là chuẩn mực, Rubin sẽ định nghĩa lại hoàn toàn đường cong chi phí AI trong 18 tháng tới.

⚔️ Vì sao Rubin quan trọng với cả ngành AI

NVIDIA đang chịu áp lực thật sự. AMD và Meta đẩy mạnh quan hệ đối tác MI450 6 gigawatt, các xưởng đúc ASIC chuyên dụng cho Google, Amazon đang nở rộ. Rubin là vũ khí để NVIDIA duy trì thế độc tôn.

Quan trọng hơn, việc giảm 10x chi phí inference tạo áp lực giảm giá trực tiếp lên OpenAI, Anthropic và Google. Khi hạ tầng rẻ hơn 10 lần, giá API buộc phải giảm theo, và người dùng cuối là bên hưởng lợi. Đây có thể là chất xúc tác cho làn sóng ứng dụng AI giá rẻ kế tiếp.

Bạn nghĩ Rubin có đủ sức giữ NVIDIA trên đỉnh thêm 2 năm nữa, hay AMD và các ASIC riêng sẽ chen chân vào miếng bánh này?

#AI #NVIDIA #Rubin #VeraRubin #VibeAICoder

Bài viết liên quan

⚡ NVIDIA Vera Rubin chính thức sản xuất: 50 PFLOPS, 288GB HBM4, rẻ hơn 10 lần | Vibe AI Coder