Meta ra mắt bộ sưu tập mô hình AI Llama 4 với hiệu suất vượt trội, sẵn sàng cạnh tranh cùng DeepSeek

Ngày đăng: Thứ ba, 08/04/2025 (GMT+7) - 16 Lượt xem

Đăng bởi: Công Ty TNHH Thương Mại Và Dịch Vụ Nina

Địa chỉ: Lầu 3, Tòa nhà SaigonTel, Lô 46, CVPM Quang Trung, P. Tân Chánh Hiệp, Q. 12, TP HCM

    Meta, công ty mẹ của Facebook, vừa công bố bộ sưu tập mô hình trí tuệ nhân tạo (AI) mới mang tên Llama 4, bao gồm ba phiên bản: Llama 4 Scout, Llama 4 Maverick và Llama 4 Behemoth. Động thái này đánh dấu bước tiến quan trọng của Meta trong lĩnh vực AI và thể hiện sự cạnh tranh trực tiếp với các đối thủ như DeepSeek.

    meta giới thiệu llama 4

    Giới thiệu về Llama 4

    Llama 4 là thế hệ mô hình AI mới nhất của Meta, được thiết kế để cung cấp hiệu suất vượt trội trong các nhiệm vụ xử lý ngôn ngữ tự nhiên và học máy. Bộ sưu tập này bao gồm ba mô hình chính:

    • Llama 4 Scout: Mô hình nhỏ gọn, có thể chạy trên một GPU Nvidia H100 duy nhất, với cửa sổ ngữ cảnh lên đến 10 triệu token. Scout được đánh giá cao về hiệu suất, vượt trội so với các mô hình như Gemma 3 và Mistral 3.1 trong nhiều bài kiểm tra đánh giá phổ biến.

    • Llama 4 Maverick: Mô hình có quy mô lớn hơn, được so sánh với GPT-4o và Gemini 2.0 Flash. Maverick cho hiệu năng tương đương với các mô hình hàng đầu hiện nay trong các bài kiểm tra mã hóa và suy luận, nhưng sử dụng ít hơn một nửa số tham số hoạt động.

    • Llama 4 Behemoth: Mô hình lớn nhất trong bộ sưu tập, với 288 tỷ tham số hoạt động và tổng cộng 2.000 tỷ tham số. Dù chưa được phát hành, Meta cho biết Behemoth có thể vượt qua các đối thủ như GPT-4.5 và Claude Sonnet 3.7 trong nhiều bài kiểm tra liên quan đến lĩnh vực STEM (khoa học, công nghệ, kỹ thuật và toán học). 

    Kiến trúc "Mixture of Experts" (MoE)

    Với Llama 4, Meta đã chuyển sang sử dụng kiến trúc "mixture of experts" (MoE), một phương pháp cho phép tiết kiệm tài nguyên bằng cách chỉ kích hoạt các phần cần thiết của mô hình tùy theo từng nhiệm vụ cụ thể. Điều này giúp tối ưu hóa hiệu suất và giảm thiểu yêu cầu về tài nguyên tính toán.

    Tích hợp và Ứng dụng

    Các mô hình Llama 4 đã được tích hợp vào trợ lý Meta AI trên nền web cũng như trong các ứng dụng phổ biến như WhatsApp, Messenger và Instagram. Người dùng có thể truy cập và sử dụng các tính năng AI tiên tiến thông qua các nền tảng này.

    Giấy phép và Mã nguồn mở

    Meta tuyên bố rằng Llama 4 là mã nguồn mở, tuy nhiên, đã vấp phải một số chỉ trích liên quan đến điều khoản giấy phép. Cụ thể, các tổ chức thương mại có trên 700 triệu người dùng hoạt động hàng tháng bắt buộc phải xin phép Meta trước khi sử dụng mô hình. Điều này dẫn đến tranh luận về việc liệu Llama 4 có thực sự là mã nguồn mở theo định nghĩa truyền thống hay không.

    Cạnh tranh với DeepSeek

    Sự ra mắt của Llama 4 đặt Meta vào vị trí cạnh tranh trực tiếp với DeepSeek, một công ty AI nổi bật đến từ Trung Quốc. DeepSeek đã thu hút sự chú ý với mô hình DeepSeek V3, sở hữu 671 tỷ tham số và được huấn luyện với chi phí thấp hơn đáng kể so với các mô hình tương đương. DeepSeek V3 đã vượt qua các đối thủ như Llama 3.1 của Meta và Qwen 2.5 của Alibaba trong nhiều bài kiểm tra hiệu năng. 

    Đáng chú ý, DeepSeek V3 được huấn luyện hoàn toàn trên GPU Nvidia H800, loại GPU có hiệu năng thấp hơn và được phép xuất khẩu sang Trung Quốc, cho thấy khả năng tối ưu hóa tài nguyên và chi phí của DeepSeek. 

    Đầu tư của Meta vào AI

    Bất chấp sự cạnh tranh từ DeepSeek và các đối thủ khác, Meta vẫn cam kết đầu tư mạnh mẽ vào AI. CEO Mark Zuckerberg đã công bố kế hoạch chi hơn 60 tỷ đô la trong năm 2025 cho các chi tiêu vốn, chủ yếu là các trung tâm dữ liệu, nhằm củng cố hạ tầng AI của công ty. Zuckerberg nhấn mạnh rằng đầu tư vào hạ tầng AI sẽ là lợi thế chiến lược cho Meta, đặc biệt khi công ty có hàng tỷ người dùng.

    Việc ra mắt bộ sưu tập mô hình AI Llama 4 đánh dấu bước tiến quan trọng của Meta trong lĩnh vực trí tuệ nhân tạo, đồng thời thể hiện sự cạnh tranh mạnh mẽ với các đối thủ như DeepSeek. Với các mô hình đa dạng và hiệu suất cao, cùng với cam kết đầu tư mạnh mẽ vào hạ tầng AI, Meta đang khẳng định vị thế của mình trong cuộc đua công nghệ AI toàn cầu.