Meta ra mắt mô hình AI Llama 4, tuyên bố “hiệu suất cao nhất thế giới” và sẵn sàng cạnh tranh với DeepSeek

Admin
Llama 4 bao gồm ba mô hình: Llama 4 Scout, Llama 4 Maverick và Llama 4 Behemoth.
Meta ra mắt mô hình AI Llama 4, tuyên bố “hiệu suất cao nhất thế giới” và sẵn sàng cạnh tranh với DeepSeek- Ảnh 1.

Meta vừa công bố Llama 4, bộ sưu tập mô hình AI mới nhất hiện đã được tích hợp vào trợ lý Meta AI trên nền web cũng như trong các ứng dụng WhatsApp, Messenger và Instagram.

Hai mô hình mới – Llama 4 Scout và Llama 4 Maverick – hiện có thể tải về trực tiếp từ Meta hoặc qua nền tảng Hugging Face. Scout là một mô hình nhỏ có thể chạy trên một GPU Nvidia H100 duy nhất, trong khi Maverick có quy mô lớn hơn, được so sánh với GPT-4o và Gemini 2.0 Flash. Meta cũng cho biết họ đang tiếp tục huấn luyện mô hình Llama 4 Behemoth, mà theo CEO Mark Zuckerberg là “mô hình nền có hiệu suất cao nhất thế giới hiện nay.”

Meta ra mắt mô hình AI Llama 4, tuyên bố “hiệu suất cao nhất thế giới” và sẵn sàng cạnh tranh với DeepSeek- Ảnh 2.

Theo Meta, Llama 4 Scout sở hữu cửa sổ ngữ cảnh lên tới 10 triệu token – được ví như bộ nhớ làm việc của một mô hình AI – và vượt trội so với các mô hình như Gemma 3, Gemini 2.0 Flash-Lite của Google và Mistral 3.1 mã nguồn mở trên nhiều bài kiểm tra đánh giá phổ biến, dù vẫn chỉ cần một GPU Nvidia H100 để vận hành. Meta cũng đưa ra tuyên bố tương tự với Maverick, cho rằng mô hình này cho hiệu năng tương đương GPT-4o và Gemini 2.0 Flash, thậm chí so sánh được với DeepSeek-V3 trong các bài kiểm tra mã hóa và suy luận, nhưng sử dụng chưa đến một nửa số tham số hoạt động.

Trong khi đó, Llama 4 Behemoth là mô hình lớn nhất trong bộ sưu tập, với 288 tỷ tham số hoạt động và tổng cộng 2.000 tỷ tham số. Dù chưa được phát hành, Meta cho biết Behemoth có thể vượt qua các đối thủ như GPT-4.5 và Claude Sonnet 3.7 trong nhiều bài kiểm tra liên quan đến lĩnh vực STEM (khoa học, công nghệ, kỹ thuật và toán học).

Đối với Llama 4, Meta đã chuyển sang kiến trúc “mixture of experts” (MoE) – một cách tiếp cận giúp tiết kiệm tài nguyên bằng cách chỉ kích hoạt các phần cần thiết của mô hình tùy theo từng nhiệm vụ. Công ty dự kiến sẽ chia sẻ thêm về các kế hoạch AI trong tương lai tại sự kiện LlamaCon, dự kiến tổ chức vào ngày 29/4 tới.

Tương tự các phiên bản trước, Meta gọi Llama 4 là mã nguồn mở (open-source), tuy nhiên đã vấp phải chỉ trích liên quan đến điều khoản giấy phép. Ví dụ, các tổ chức thương mại có trên 700 triệu người dùng hoạt động hàng tháng bắt buộc phải xin phép Meta trước khi sử dụng mô hình, điều này – theo Tổ chức Sáng kiến Mã nguồn mở (Open Source Initiative) – đã khiến Llama “không còn thuộc phạm trù mã nguồn mở thực sự” theo định nghĩa truyền thống.