Google vừa chính thức phát hành Gemma 4 — dòng model mã nguồn mở mới nhất, được xây dựng từ cùng nền tảng nghiên cứu với Gemini 3. Điểm đặc biệt: Gemma 4 mang đến khả năng reasoning nâng cao, function calling native, hiểu đa phương thức (multimodal), và context window lên đến 256K — tất cả trong một gói license Apache 2.0 cho phép sử dụng thương mại hoàn toàn.
2 Phiên Bản Gemma 4
Hiện tại có 2 model có sẵn qua Gemini API:
gemma-4-26b-a4b-it— 26B parameters (MoE)gemma-4-31b-it— 31B parameters (Dense)
Thứ Hạng Trên Bảng Xếp Hạng
Model 31B dense hiện đứng #3 trên bảng xếp hạng Arena AI (text), còn 26B MoE đứng #6 — cạnh tranh với các model gấp 20 lần kích thước.
Tính Năng Nổi Bật
1. Context Window 256K
Cả hai model đều hỗ trợ context window lên đến 256K tokens, cho phép xử lý tài liệu dài, phân tích codebase lớn, hoặc giữ nguyên ngữ cảnh trong những cuộc trò chuyện dài.
2. Native Function Calling & Structured Output
Không cần prompt engineering phức tạp — Gemma 4 hỗ trợ function calling và output dạng JSON có cấu trúc ngay từ model level. Điều này giúp xây dựng AI agents đáng tin cậy hơn nhiều.
3. Multimodal: Text, Image, Video
Model có khả năng hiểu và xử lý đồng thợi text, hình ảnh, và video — mở ra khả năng ứng dụng đa dạng từ phân tích visual đến content generation.
4. Đa Ngôn Ngữ
Được train với 140+ ngôn ngữ, trong đó có tiếng Việt — performance trên các ngôn ngữ không phải tiếng Anh được cải thiện đáng kể so với các thế hệ trước.
5. License Apache 2.0
Toàn quyền sử dụng thương mại, không giới hạn. Có thể deploy trên cloud, on-premise, hoặc edge devices mà không lo vấn đề license.
Bắt Đầu Với Google AI Studio
Cách nhanh nhất để thử Gemma 4 là qua Google AI Studio:
- Truy cập AI Studio
- Chọn model từ dropdown (gemma-4-26b-a4b-it hoặc gemma-4-31b-it)
- Nhập prompt và bắt đầu chat
Không cần API key, không cần code — tất cả đều chạy trên browser. Bạn có thể test system instructions, điều chỉnh temperature, và thử multimodal inputs ngay lập tức.
Sử Dụng Với Gemini API
Để integrate vào ứng dụng, cài đặt Python SDK:
pip install google-genai
Export API key và bắt đầu generate:
export GEMINI_API_KEY="your-api-key"
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemma-4-26b-a4b-it",
contents="Giải thích DeFi bằng tiếng Việt đơn giản"
)
print(response.text)
Tích Hợp Nâng Cao
Function Calling
Định nghĩa tools dưới dạng function declarations, model tự quyết định khi nào gọi:
get_weather = {
"name": "get_weather",
"description": "Lấy thởi tiết hiện tại",
"parameters": {
"type": "object",
"properties": {
"location": {"type": "string"}
},
"required": ["location"]
}
}
Google Search Grounding
Kết hợp với Google Search để responses dựa trên dữ liệu web real-time:
response = client.models.generate_content(
model="gemma-4-26b-a4b-it",
contents="Giá Bitcoin hôm nay?",
config=types.GenerateContentConfig(
tools=[{"google_search":{}}]
)
)
Tài Nguyên & Tài Liệu
- Google AI Studio — Thử nghiệm trực tiếp
- Gemini API Docs — Tài liệu API
- Gemma Documentation — Hướng dẫn chi tiết
- Gemma Cookbooks — Code examples
Gemma 4 đánh dấu bước tiến quan trọng cho cộng đồng open-source AI — khi mà performance competitive với các model closed-source lớn nhưng hoàn toàn free và open. Đây là cơ hội tốt cho developers Việt Nam xây dựng ứng dụng AI mà không lo chi phí license.