Google ra mắt Gemma 4: Đưa sức mạnh của Gemini 3 đến với cộng đồng mã nguồn mở

💡 Đội ngũ RetroLab nhận thấy việc Google chuyển sang giấy phép Apache 2.0 là một tín hiệu cho thấy họ đang quyết tâm giành lại thị phần trong cộng đồng AI mở trước sự áp đảo của Meta. Theo đánh giá của RetroLab, khả năng tối ưu hóa trí thông minh trên mỗi tham số của Gemma 4 sẽ khiến nó trở thành lựa chọn hàng đầu cho các ứng dụng AI chạy trực tiếp trên thiết bị di động.

Tiếp nối thành công của Gemini 3 Pro ra mắt cuối năm ngoái, Google vừa chính thức giới thiệu Gemma 4, một gia đình các mô hình ngôn ngữ lớn (LLM) dạng open-weight. Đây là nỗ lực của Google trong việc chia sẻ những nghiên cứu và công nghệ cốt lõi từ dòng Gemini sang cộng đồng phát triển mở, cho phép các lập trình viên tiếp cận với trí tuệ nhân tạo tiên tiến một cách linh hoạt hơn.

screenshot_2026-04-02_at_9.51.06%E2%80%AFam_4526.png

Phân cấp mô hình tối ưu cho mọi thiết bị

Để đáp ứng nhu cầu đa dạng từ thiết bị di động cho đến máy chủ hiệu năng cao, Google cung cấp Gemma 4 với bốn phiên bản khác nhau, phân chia theo số lượng tham số (parameters) — yếu tố quyết định khả năng xử lý và độ chính xác của mô hình:

Phiên bản 2 tỷ và 4 tỷ (Effective): Được tối ưu đặc biệt cho các thiết bị edge như smartphone, giúp chạy AI trực tiếp trên thiết bị mà không cần phụ thuộc vào đám mây.
Phiên bản 26 tỷ (Mixture of Experts): Sử dụng kiến trúc MoE để cân bằng giữa hiệu suất mạnh mẽ và tài nguyên tính toán.
Phiên bản 31 tỷ (Dense): Mô hình đầy đủ với khả năng suy luận chuyên sâu nhất trong gia đình Gemma 4.

Điểm đáng chú ý là Google khẳng định đã đạt được mức độ "trí thông minh trên mỗi tham số" chưa từng có. Minh chứng rõ nhất là trên bảng xếp hạng Arena AI, hai biến thể 26 tỷ và 31 tỷ tham số lần lượt xếp vị trí thứ 3 và thứ 6, vượt mặt nhiều mô hình khác có kích thước lớn gấp 20 lần.

Khả năng đa phương thức và lập trình offline

Không chỉ dừng lại ở văn bản, toàn bộ gia đình Gemma 4 đều có khả năng xử lý hình ảnh và video, hỗ trợ đắc lực cho các tác vụ như nhận dạng ký tự quang học (OCR). Đặc biệt, hai phiên bản nhỏ nhất (2B và 4B) còn có thể tiếp nhận đầu vào bằng âm thanh và hiểu tiếng nói.

Một tính năng gây ấn tượng cho giới lập trình là khả năng tạo mã nguồn offline. Điều này cho phép người dùng thực hiện "vibe coding" — lập trình dựa trên ý tưởng và mô tả — mà không cần kết nối internet. Ngoài ra, Google cũng đã huấn luyện Gemma 4 hỗ trợ hơn 140 ngôn ngữ khác nhau, xóa bỏ rào cản tiếp cận toàn cầu.

Bước ngoặt về giấy phép sử dụng

Thay vì sử dụng giấy phép riêng như các thế hệ trước, Google đã phát hành Gemma 4 dưới giấy phép Apache 2.0. Đây là một thay đổi quan trọng, mang lại sự tự do gần như tuyệt đối cho các nhà phát triển trong việc chỉnh sửa, tùy biến và triển khai mô hình theo nhu cầu riêng.

"Giấy phép mã nguồn mở này cung cấp nền tảng cho sự linh hoạt hoàn toàn của nhà phát triển và chủ quyền kỹ thuật số; trao cho bạn quyền kiểm soát toàn diện đối với dữ liệu, cơ sở hạ tầng và mô hình. Nó cho phép bạn xây dựng tự do và triển khai an toàn trong bất kỳ môi trường nào, dù là on-premises hay trên đám mây."

Hiện tại, người dùng và các nhà phát triển có thể trải nghiệm và tải về trọng số (weights) của các mô hình này thông qua các nền tảng phổ biến như Hugging Face, Kaggle và Ollama.

Nguồn: Engadget - https://www.engadget.com/ai/google-releases-gemma-4-a-family-of-open-models-built-off-of-gemini-3-160000332.html?src=rss

Phân cấp mô hình tối ưu cho mọi thiết bị

Phiên bản 2 tỷ và 4 tỷ (Effective): Được tối ưu đặc biệt cho các thiết bị edge như smartphone, giúp chạy AI trực tiếp trên thiết bị mà không cần phụ thuộc vào đám mây.

Phiên bản 26 tỷ (Mixture of Experts): Sử dụng kiến trúc MoE để cân bằng giữa hiệu suất mạnh mẽ và tài nguyên tính toán.

Phiên bản 31 tỷ (Dense): Mô hình đầy đủ với khả năng suy luận chuyên sâu nhất trong gia đình Gemma 4.

Khả năng đa phương thức và lập trình offline

Bước ngoặt về giấy phép sử dụng

"Giấy phép mã nguồn mở này cung cấp nền tảng cho sự linh hoạt hoàn toàn của nhà phát triển và chủ quyền kỹ thuật số; trao cho bạn quyền kiểm soát toàn diện đối với dữ liệu, cơ sở hạ tầng và mô hình. Nó cho phép bạn xây dựng tự do và triển khai an toàn trong bất kỳ môi trường nào, dù là on-premises hay trên đám mây."

Google ra mắt Gemma 4: Đưa sức mạnh của Gemini 3 đến với cộng đồng mã nguồn mở

Phân cấp mô hình tối ưu cho mọi thiết bị

Khả năng đa phương thức và lập trình offline

Bước ngoặt về giấy phép sử dụng

You May Also Like

Thế hệ Gen Z lo ngại về AI: Lý do đằng sau sự hoài nghi và nỗi sợ mất việc

Googlebooks: Laptop Android cao cấp mới, tích hợp Gemini AI và công nghệ 'Cast My Apps' đột phá

Trí tuệ nhân tạo Claude Mythos phát hiện hơn 10.000 lỗ hổng bảo mật nghiêm trọng trong phần mềm

Github Copilot thay đổi cách tính phí: Làn sóng phản ứng dữ dội từ cộng đồng lập trình viên

Microsoft Build 2026: Liệu giao thức NLWeb có thay đổi cách chúng ta tương tác với trình duyệt web?

YouTube siết chặt quản lý video giả mạo bằng AI với thuật toán nhận diện mới

Google ra mắt Gemma 4: Đưa sức mạnh của Gemini 3 đến với cộng đồng mã nguồn mở

Phân cấp mô hình tối ưu cho mọi thiết bị

Khả năng đa phương thức và lập trình offline

Bước ngoặt về giấy phép sử dụng

You May Also Like

Thế hệ Gen Z lo ngại về AI: Lý do đằng sau sự hoài nghi và nỗi sợ mất việc

Googlebooks: Laptop Android cao cấp mới, tích hợp Gemini AI và công nghệ 'Cast My Apps' đột phá

Trí tuệ nhân tạo Claude Mythos phát hiện hơn 10.000 lỗ hổng bảo mật nghiêm trọng trong phần mềm

Github Copilot thay đổi cách tính phí: Làn sóng phản ứng dữ dội từ cộng đồng lập trình viên

Microsoft Build 2026: Liệu giao thức NLWeb có thay đổi cách chúng ta tương tác với trình duyệt web?

YouTube siết chặt quản lý video giả mạo bằng AI với thuật toán nhận diện mới

Lan tỏa thương hiệu của bạn