AI & Công Nghệ

Gemma 4 Chính Thức Ra Mắt: 256K Context, Multimodal, Apache 2.0

Apr 04, 2026 8 min read Google AI Studio

Google vừa chính thức phát hành Gemma 4 — dòng model mã nguồn mở mới nhất, được xây dựng từ cùng nền tảng nghiên cứu với Gemini 3. Điểm đặc biệt: Gemma 4 mang đến khả năng reasoning nâng cao, function calling native, hiểu đa phương thức (multimodal), và context window lên đến 256K — tất cả trong một gói license Apache 2.0 cho phép sử dụng thương mại hoàn toàn.

2 Phiên Bản Gemma 4

Hiện tại có 2 model có sẵn qua Gemini API:

gemma-4-26b-a4b-it — 26B parameters (MoE)
gemma-4-31b-it — 31B parameters (Dense)

Thứ Hạng Trên Bảng Xếp Hạng

Model 31B dense hiện đứng #3 trên bảng xếp hạng Arena AI (text), còn 26B MoE đứng #6 — cạnh tranh với các model gấp 20 lần kích thước.

Tính Năng Nổi Bật

1. Context Window 256K

Cả hai model đều hỗ trợ context window lên đến 256K tokens, cho phép xử lý tài liệu dài, phân tích codebase lớn, hoặc giữ nguyên ngữ cảnh trong những cuộc trò chuyện dài.

2. Native Function Calling & Structured Output

Không cần prompt engineering phức tạp — Gemma 4 hỗ trợ function calling và output dạng JSON có cấu trúc ngay từ model level. Điều này giúp xây dựng AI agents đáng tin cậy hơn nhiều.

3. Multimodal: Text, Image, Video

Model có khả năng hiểu và xử lý đồng thợi text, hình ảnh, và video — mở ra khả năng ứng dụng đa dạng từ phân tích visual đến content generation.

4. Đa Ngôn Ngữ

Được train với 140+ ngôn ngữ, trong đó có tiếng Việt — performance trên các ngôn ngữ không phải tiếng Anh được cải thiện đáng kể so với các thế hệ trước.

5. License Apache 2.0

Toàn quyền sử dụng thương mại, không giới hạn. Có thể deploy trên cloud, on-premise, hoặc edge devices mà không lo vấn đề license.

Bắt Đầu Với Google AI Studio

Cách nhanh nhất để thử Gemma 4 là qua Google AI Studio:

Truy cập AI Studio
Chọn model từ dropdown (gemma-4-26b-a4b-it hoặc gemma-4-31b-it)
Nhập prompt và bắt đầu chat

Không cần API key, không cần code — tất cả đều chạy trên browser. Bạn có thể test system instructions, điều chỉnh temperature, và thử multimodal inputs ngay lập tức.

Sử Dụng Với Gemini API

Để integrate vào ứng dụng, cài đặt Python SDK:

pip install google-genai

Export API key và bắt đầu generate:

export GEMINI_API_KEY="your-api-key"

from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="gemma-4-26b-a4b-it",
    contents="Giải thích DeFi bằng tiếng Việt đơn giản"
)
print(response.text)

Tích Hợp Nâng Cao

Function Calling

Định nghĩa tools dưới dạng function declarations, model tự quyết định khi nào gọi:

get_weather = {
    "name": "get_weather",
    "description": "Lấy thởi tiết hiện tại",
    "parameters": {
        "type": "object",
        "properties": {
            "location": {"type": "string"}
        },
        "required": ["location"]
    }
}

Google Search Grounding

Kết hợp với Google Search để responses dựa trên dữ liệu web real-time:

response = client.models.generate_content(
    model="gemma-4-26b-a4b-it",
    contents="Giá Bitcoin hôm nay?",
    config=types.GenerateContentConfig(
        tools=[{"google_search":{}}]
    )
)

Tài Nguyên & Tài Liệu

Google AI Studio — Thử nghiệm trực tiếp
Gemini API Docs — Tài liệu API
Gemma Documentation — Hướng dẫn chi tiết
Gemma Cookbooks — Code examples

Gemma 4 đánh dấu bước tiến quan trọng cho cộng đồng open-source AI — khi mà performance competitive với các model closed-source lớn nhưng hoàn toàn free và open. Đây là cơ hội tốt cho developers Việt Nam xây dựng ứng dụng AI mà không lo chi phí license.