DeepSeek, một startup AI đến từ Trung Quốc, đã gây chấn động ngành công nghệ khi ra mắt mô hình ngôn ngữ lớn (LLM) R1-0528. Điểm nổi bật của mô hình này là khả năng hoạt động trên chỉ một GPU duy nhất, cụ thể là Nvidia H100 với 40-80GB VRAM, mà vẫn đạt hiệu suất tương đương với các mô hình hàng đầu như GPT-4o của OpenAI hay Gemini 2.5 Pro của Google.
Phiên bản "chưng cất" DeepSeek-R1-0528-Qwen3-8B, dựa trên nền tảng Qwen3-8B của Alibaba, đã chứng minh khả năng vượt trội trong các bài kiểm tra toán học như AIME 2025 và HMMT, thậm chí vượt qua Gemini 2.5 Flash của Google.
Trái tim của DeepSeek R1-0528 là kiến trúc Mixture-of-Experts (MoE), cho phép kích hoạt chỉ 37 tỷ trong tổng số 671 tỷ tham số cho mỗi tác vụ cụ thể. Điều này giúp giảm đáng kể chi phí tính toán và năng lượng tiêu thụ, đồng thời duy trì hiệu suất cao.
Ngoài ra, DeepSeek áp dụng kỹ thuật học tăng cường thuần túy (pure reinforcement learning) và quantization, giảm độ chính xác tham số từ 32-bit xuống 8-bit, giúp tiết kiệm 75% lưu lượng bộ nhớ mà không ảnh hưởng đến hiệu năng.
DeepSeek tuyên bố đã phát triển mô hình R1-0528 với chi phí dưới 6 triệu USD trong vòng hai tháng, sử dụng GPU H800 của Nvidia – một phiên bản hạ cấp so với H100. Điều này trái ngược hoàn toàn với các công ty như OpenAI, Meta hay Google, vốn đầu tư hàng tỷ USD vào phát triển AI.
Hơn nữa, DeepSeek phát hành mô hình của mình dưới giấy phép MIT, cho phép sử dụng thương mại không hạn chế, thúc đẩy sự dân chủ hóa công nghệ AI và mở ra cơ hội cho các doanh nghiệp nhỏ và nhà phát triển độc lập.
Sự xuất hiện của DeepSeek R1-0528 đã khiến các công ty công nghệ lớn phải điều chỉnh chiến lược. Google đã giới thiệu các gói dịch vụ Gemini giảm giá, trong khi OpenAI phát hành mô hình o3 Mini ít tốn tài nguyên tính toán hơn.
Ngoài ra, thành công của DeepSeek đặt ra thách thức đối với các lệnh cấm xuất khẩu công nghệ của Mỹ nhằm kìm hãm sự phát triển AI của Trung Quốc, cho thấy những biện pháp này không đạt được hiệu quả như mong đợi.
DeepSeek R1-0528 đánh dấu một bước ngoặt quan trọng trong ngành AI toàn cầu, chứng minh rằng với chiến lược đúng đắn và tối ưu hóa công nghệ, các startup có thể cạnh tranh sòng phẳng với những ông lớn công nghệ. Sự kiện này không chỉ thúc đẩy sự đổi mới trong ngành mà còn mở ra cơ hội cho nhiều đối tượng tiếp cận và phát triển AI.