💡 Đội ngũ RetroLab nhận thấy việc Google chuyển sang giấy phép Apache 2.0 là một tín hiệu cho thấy họ đang quyết tâm giành lại thị phần trong cộng đồng AI mở trước sự áp đảo của Meta. Theo đánh giá của RetroLab, khả năng tối ưu hóa trí thông minh trên mỗi tham số của Gemma 4 sẽ khiến nó trở thành lựa chọn hàng đầu cho các ứng dụng AI chạy trực tiếp trên thiết bị di động.
Tiếp nối thành công của Gemini 3 Pro ra mắt cuối năm ngoái, Google vừa chính thức giới thiệu Gemma 4, một gia đình các mô hình ngôn ngữ lớn (LLM) dạng open-weight. Đây là nỗ lực của Google trong việc chia sẻ những nghiên cứu và công nghệ cốt lõi từ dòng Gemini sang cộng đồng phát triển mở, cho phép các lập trình viên tiếp cận với trí tuệ nhân tạo tiên tiến một cách linh hoạt hơn.

Phân cấp mô hình tối ưu cho mọi thiết bị
Để đáp ứng nhu cầu đa dạng từ thiết bị di động cho đến máy chủ hiệu năng cao, Google cung cấp Gemma 4 với bốn phiên bản khác nhau, phân chia theo số lượng tham số (parameters) — yếu tố quyết định khả năng xử lý và độ chính xác của mô hình:
- Phiên bản 2 tỷ và 4 tỷ (Effective): Được tối ưu đặc biệt cho các thiết bị edge như smartphone, giúp chạy AI trực tiếp trên thiết bị mà không cần phụ thuộc vào đám mây.
- Phiên bản 26 tỷ (Mixture of Experts): Sử dụng kiến trúc MoE để cân bằng giữa hiệu suất mạnh mẽ và tài nguyên tính toán.
- Phiên bản 31 tỷ (Dense): Mô hình đầy đủ với khả năng suy luận chuyên sâu nhất trong gia đình Gemma 4.
Điểm đáng chú ý là Google khẳng định đã đạt được mức độ "trí thông minh trên mỗi tham số" chưa từng có. Minh chứng rõ nhất là trên bảng xếp hạng Arena AI, hai biến thể 26 tỷ và 31 tỷ tham số lần lượt xếp vị trí thứ 3 và thứ 6, vượt mặt nhiều mô hình khác có kích thước lớn gấp 20 lần.
Khả năng đa phương thức và lập trình offline
Không chỉ dừng lại ở văn bản, toàn bộ gia đình Gemma 4 đều có khả năng xử lý hình ảnh và video, hỗ trợ đắc lực cho các tác vụ như nhận dạng ký tự quang học (OCR). Đặc biệt, hai phiên bản nhỏ nhất (2B và 4B) còn có thể tiếp nhận đầu vào bằng âm thanh và hiểu tiếng nói.
Một tính năng gây ấn tượng cho giới lập trình là khả năng tạo mã nguồn offline. Điều này cho phép người dùng thực hiện "vibe coding" — lập trình dựa trên ý tưởng và mô tả — mà không cần kết nối internet. Ngoài ra, Google cũng đã huấn luyện Gemma 4 hỗ trợ hơn 140 ngôn ngữ khác nhau, xóa bỏ rào cản tiếp cận toàn cầu.
Bước ngoặt về giấy phép sử dụng
Thay vì sử dụng giấy phép riêng như các thế hệ trước, Google đã phát hành Gemma 4 dưới giấy phép Apache 2.0. Đây là một thay đổi quan trọng, mang lại sự tự do gần như tuyệt đối cho các nhà phát triển trong việc chỉnh sửa, tùy biến và triển khai mô hình theo nhu cầu riêng.
"Giấy phép mã nguồn mở này cung cấp nền tảng cho sự linh hoạt hoàn toàn của nhà phát triển và chủ quyền kỹ thuật số; trao cho bạn quyền kiểm soát toàn diện đối với dữ liệu, cơ sở hạ tầng và mô hình. Nó cho phép bạn xây dựng tự do và triển khai an toàn trong bất kỳ môi trường nào, dù là on-premises hay trên đám mây."
Hiện tại, người dùng và các nhà phát triển có thể trải nghiệm và tải về trọng số (weights) của các mô hình này thông qua các nền tảng phổ biến như Hugging Face, Kaggle và Ollama.
Nguồn: Engadget - https://www.engadget.com/ai/google-releases-gemma-4-a-family-of-open-models-built-off-of-gemini-3-160000332.html?src=rss





