Trong một bước tiến quan trọng, Dell Technologies đã công bố một loạt cải tiến đột phá cho phép các doanh nghiệp triển khai các giải pháp AI nhanh hơn, hiệu quả hơn và tiết kiệm chi phí lên tới 62%. Những cải tiến này tập trung vào cả phần cứng (máy chủ, tăng tốc trình suy luận) lẫn phần mềm (container, nền tảng triển khai, dịch vụ chuyên môn), giúp tối ưu toàn diện chu trình AI từ giai đoạn thử nghiệm đến vận hành thực tế.
Dell đã tích hợp sâu bộ tăng tốc AMD Instinct MI300X vào các dòng máy chủ PowerEdge XE9680, mở ra cơ hội để triển khai mô hình AI dạng lớn (on‑premise). Bên cạnh đó, các model R6715, R7715, R6725 và R7725 cũng được hỗ trợ từ cuối năm 2024, đảm bảo doanh nghiệp có lựa chọn phù hợp tùy vào nhu cầu và ngân sách.
Nhờ tích hợp trên, dòng máy chủ Dell Enterprise Hub trên nền tảng Hugging Face hỗ trợ tốt cho các mô hình như Llama và Mixtral. Những mô hình này được đóng gói thành container tối ưu hóa riêng theo khả năng suy luận, giúp giảm thiểu thời gian thiết lập và tăng hiệu quả triển khai.
Với giải pháp container hóa các mô hình trên nền tảng Hugging Face TGI (Text Generation Inference), Dell cho biết thời gian từ giai đoạn phát triển đến khi mô hình hoạt động thực tế có thể giảm tới 86%.
Container tích hợp sẵn bộ lệnh tùy chỉnh, tối ưu bảo mật và khả năng tương tác, giúp doanh nghiệp chỉ cần “plug‑and‑play”—đẩy nhanh quá trình thử nghiệm và vận hành thực tế, và đặc biệt là tăng hiệu suất ROI trên mỗi đồng đầu tư AI.
Không chỉ dừng ở phần cứng, Dịch vụ Chuyên môn của Dell dành cho AI tạo sinh (Generative AI) cũng được mở rộng để tương thích với hạ tầng dùng CPU và GPU của AMD.
Thông qua dịch vụ triển khai nền tảng GenAI (GenAI Platform Deployment Service), Dell cung cấp trọn gói từ:
Tư vấn chiến lược: Xác định mục tiêu, lựa chọn mô hình phù hợp
Chuẩn bị dữ liệu: Làm sạch, dán nhãn, xây dựng pipeline dữ liệu
Triển khai nền tảng: Thiết lập Kubernetes, rollout container
Chuyển giao kỹ năng: Đào tạo đội ngũ nội bộ, hỗ trợ thực thi, đo lường ROI
Việc hỗ trợ môi trường AMD giúp giải pháp AI tăng tính linh hoạt, mở rộng dữ liệu và tiết kiệm chi phí so với các hệ thống GPU truyền thống.
Dell tiếp tục hoàn thiện hệ sinh thái AI thông qua gói giải pháp AI Factory, bao gồm:
Phân phối PowerEdge XE7745 (có khả năng mở rộng cao) dự kiến từ tháng 1/2025
Các máy chủ dòng R-series khả dụng toàn cầu từ tháng 11/2024
Ra mắt các giải pháp AI tạo sinh (Generative AI) dung AMD từ Quý IV/2024
Hệ sinh thái này nhằm hỗ trợ toàn bộ chu trình AI – từ thử nghiệm mô hình đến vận hành quy mô dự án – mang đến cho khách hàng giải pháp “end‑to‑end” từ Dell + AMD + Hugging Face.
Dell cho biết việc kết hợp giữa container hóa, tối ưu phần cứng, và dịch vụ triển khai toàn diện giúp doanh nghiệp tiết kiệm đáng kể:
Tận dụng hạ tầng AMD giúp giảm chi phí đầu tư so với GPU truyền thống
Triển khai nhanh nhờ container hóa tiết kiệm thời gian setup, vận hành
Quản lý hiệu quả vòng đời dự án AI bằng dịch vụ chuyên môn của Dell Professional Services
Kết quả: doanh nghiệp có thể triển khai AI hiệu quả hơn – nhanh hơn, ít tốn nhân lực, giảm rủi ro và đảm bảo ROI – với mức giảm chi phí lên đến 62% so với các giải pháp custom trước đây.
Ông Kuba Stolarski, Phó chủ tịch Nghiên cứu tại IDC, chia sẻ:
“Dell Technologies và AMD tiếp tục thúc đẩy sự đổi mới AI, cung cấp các giải pháp và dịch vụ toàn diện để hỗ trợ các doanh nghiệp hiện đại hóa trung tâm dữ liệu, cải thiện khả năng mở rộng, và khai thác AI để đạt được kết quả kinh doanh tốt hơn. Những bổ sung mới cho Dell AI Factory là bước kế tiếp của Dell trong hành trình…”
Ý kiến này không chỉ khẳng định tính đúng đắn của chiến lược “AI Factory” mà còn thể hiện sự tin tưởng vào việc AI – đặc biệt là Generative AI – sẽ đóng vai trò ngày càng quan trọng và cần thiết trong các hệ thống doanh nghiệp hiện đại.
Dell đã lên kế hoạch cụ thể cho đợt triển khai sẽ diễn ra như sau:
Q4/2024: Bộ giải pháp Generative AI hỗ trợ AMD ra mắt toàn cầu
Tháng 11/2024: Phân phối PowerEdge dòng R-series (R6715, R7715, R6725, R7725)
Tháng 1/2025: Phân phối PowerEdge XE7745 hoàn chỉnh
Lộ trình rõ ràng ấy giúp doanh nghiệp nhanh chóng tiếp cận giải pháp toàn diện và kịp thời triển khai AI trong năm 2025.