Trong bối cảnh cuộc đua công nghệ AI ngày càng khốc liệt, Huawei đã giới thiệu cụm siêu máy chủ CloudMatrix 384, sử dụng 384 chip Ascend 910C. Hệ thống này đạt hiệu suất gần 300 petaFLOPS ở định dạng BF16, gần gấp đôi so với hệ thống GB200 NVL72 của NVIDIA. Tuy nhiên, mức tiêu thụ điện năng của CloudMatrix 384 lên tới 560 kW, gấp gần 4 lần so với đối thủ.
Thay vì cải tiến vi kiến trúc, Huawei tập trung vào việc tăng số lượng chip trong một cụm và kết nối chúng theo cấu trúc "all-to-all". Điều này giúp giảm độ trễ truyền dữ liệu giữa các GPU, nâng cao hiệu suất tổng thể. Tuy nhiên, cách tiếp cận này dẫn đến mức tiêu thụ điện năng cao, đặt ra thách thức về hiệu suất năng lượng.
CloudMatrix 384 không chỉ là bước tiến về công nghệ mà còn mang ý nghĩa địa chính trị. Trung Quốc đang nỗ lực xây dựng hạ tầng AI cấp quốc gia mà không phụ thuộc vào công nghệ Mỹ. Tuy nhiên, chuỗi cung ứng của Ascend 910C vẫn phụ thuộc vào các đối tác ngoài đại lục như TSMC và Samsung, khiến sản lượng còn là bài toán khó, đặc biệt khi Mỹ siết chặt xuất khẩu thiết bị bán dẫn.
Trước việc Mỹ yêu cầu giấy phép riêng để xuất khẩu GPU H20 – sản phẩm duy nhất của NVIDIA còn đáp ứng quy định hạn chế – CEO Jensen Huang đã nhanh chóng đến Bắc Kinh để trấn an khách hàng. Ông nhấn mạnh Trung Quốc vẫn là thị trường quan trọng và mong muốn tiếp tục hợp tác, cho thấy nỗ lực giữ vững thị phần trong bối cảnh cạnh tranh ngày càng gay gắt.
Mặc dù CloudMatrix 384 chưa thể vượt qua GB200 NVL72 về hiệu suất năng lượng, việc đạt thông lượng gần gấp đôi trong bối cảnh Mỹ hạn chế xuất khẩu chip đã giúp Huawei có lợi thế chiến lược. Nếu khắc phục được hạn chế về sản lượng và cải thiện quy trình sản xuất để giảm tiêu hao điện, Huawei có thể trở thành đối thủ đáng gờm của NVIDIA trong lĩnh vực AI.