Trong những năm gần đây, Trung Quốc đã đầu tư mạnh mẽ vào các công nghệ AI, đặc biệt là trong lĩnh vực mô hình ngôn ngữ lớn (LLM). Mới đây, mô hình Qwen2.5-Max do Alibaba Cloud phát triển đã gây bất ngờ khi xuất hiện trong top 10 bảng xếp hạng toàn cầu trên Chatbot Arena, một nền tảng đánh giá mô hình AI độc lập.
Theo bảng xếp hạng cập nhật mới nhất vào ngày 4/2, Qwen2.5-Max đã vượt qua nhiều tên tuổi lớn trong ngành như DeepSeek-V3, o1-mini và Claude-3.5-Sonnet. Mô hình này được đánh giá cao nhất về khả năng toán học và lập trình, đồng thời xếp thứ hai trong danh mục Hard Prompts (các lệnh phức tạp yêu cầu suy luận sâu).
Chatbot Arena, nền tảng đại diện cho các bên đánh giá AI độc lập, đã dành lời khen cho mô hình Qwen2.5-Max trên mạng xã hội X:
"Qwen-Max của Alibaba mạnh trên mọi lĩnh vực, đặc biệt về các bài toán kỹ thuật như lập trình, toán học và Hard Prompts."
Trước khi lọt vào top 10, Qwen2.5-Max đã vượt mặt DeepSeek-V3, phiên bản AI được phát hành vào tháng 12/2024. Trong một số bài kiểm tra, Qwen2.5-Max còn tỏ ra vượt trội hơn cả GPT-4o-0806 và Claude-3.5-Sonnet-1022.
Tuy nhiên, các so sánh này vẫn chưa tính đến phiên bản mới nhất của DeepSeek-R1, một mô hình AI được đào tạo trên các con chip cụ của Nvidia và hoàn toàn mã nguồn mở. DeepSeek-R1 được quảng cáo là có chi phí thấp hơn OpenAI o1 tới 96,4% nhưng vẫn đạt được hiệu suất đáng nể.
Mặc dù đạt được nhiều thành tựu và gây ấn tượng với các đối thủ quốc tế, các mô hình AI Trung Quốc vẫn đối diện với rất nhiều thách thức.
Mới đây, công ty DeepSeek đã bị Australia cấm cung cấp dịch vụ AI trên hệ thống chính phủ. Trước đó, NASA và Lầu Năm Góc (Mỹ) cũng đã có động thái tương tự do lo ngại vấn đề bảo mật.
Dù vậy, không thể phủ nhận rằng các mô hình AI của Trung Quốc đang tiến bộ một cách đáng kinh ngạc. Việc Qwen2.5-Max đạt top 10 toàn cầu là một cột mốc đáng nhớ, khẳng định rằng AI Trung Quốc đã sẵn sàng đối đầu với những ông lớn trong ngành.