Hướng dẫn Gemma 4
Giá GLM 5.2: Chi Phí API, Gói Đăng Ký & Miễn Phí (2026)

Giá GLM 5.2: Chi Phí API, Gói Đăng Ký & Miễn Phí (2026)
GLM 5.2 được Z.ai (trước đây là Zhipu AI) phát hành vào ngày 16 tháng 6 năm 2026, là mô hình Mixture-of-Experts (MoE) với 744 tỷ tham số, được xây dựng cho các tác vụ lập trình dài hạn và tác nhân AI. Mô hình hỗ trợ cửa sổ ngữ cảnh 1 triệu token và được cấp phép MIT. Với mức giá chỉ bằng khoảng 1/6 GPT-5.5, đây là một trong những mô hình frontier tiết kiệm chi phí nhất hiện nay.
Hướng dẫn này bao gồm tất cả các tùy chọn giá GLM 5.2 tính đến ngày 22 tháng 6 năm 2026 — giá API theo token, gói đăng ký GLM Coding Plan, giá OpenRouter và các cách truy cập miễn phí.
Giá có thể thay đổi bất kỳ lúc nào. Luôn kiểm tra giá hiện tại tại z.ai/subscribe và bigmodel.cn/pricing.
Tổng Quan Nhanh: Bảng Giá GLM 5.2
| Loại Truy Cập | Giá |
|---|---|
| API — Đầu vào | $1,40 / triệu token |
| API — Đầu vào có cache | $0,26 / triệu token |
| API — Đầu ra | $4,40 / triệu token |
| OpenRouter — Đầu vào | $1,00 / triệu token |
| OpenRouter — Đầu ra | $4,00 / triệu token |
| GLM Coding Lite | ~$10–$18/tháng |
| GLM Coding Pro | ~$30–$50/tháng |
| GLM Coding Max | ~$80–$112/tháng |
| Tự host (trọng số MIT) | Miễn phí (chỉ tốn phần cứng) |
| Token miễn phí người dùng mới | 20 triệu token (bigmodel.cn) |
Gói Miễn Phí GLM 5.2
1. Bonus Người Dùng Mới (bigmodel.cn)
Người dùng mới đăng ký tại bigmodel.cn nhận được 20 triệu token miễn phí cùng 120 lần tạo ảnh và video.
2. Chương Trình Token Miễn Phí Z.ai (CLI Lập Trình)
Z.ai đang cung cấp lượng token miễn phí lớn cho các nhà phát triển sử dụng Z.ai coding CLI (cộng đồng báo cáo khoảng 300 triệu token). Điều kiện và hạn ngạch có thể thay đổi — xác nhận tại z.ai.
3. Tự Host (Giấy Phép MIT)
Vì GLM 5.2 được phát hành theo giấy phép MIT, bạn có thể tải toàn bộ trọng số từ Hugging Face (zai-org/GLM-5.2) và chạy hoàn toàn miễn phí. Lưu ý: mô hình MoE 744B cần hơn 1TB VRAM GPU ở định dạng BF16.
4. Hạn Ngạch Miễn Phí Hàng Ngày của ZCode 3.0
ZCode 3.0 của Zhipu cung cấp 3 triệu token GLM 5.2 miễn phí mỗi ngày cho người dùng đủ điều kiện. Chi tiết tại open.bigmodel.cn/glm-coding.
Giá API GLM 5.2
API độc lập GLM 5.2 ra mắt ngày 16 tháng 6 năm 2026 qua nền tảng dành cho nhà phát triển Z.ai.
Giá Token (Tháng 6/2026)
| Loại Token | Giá / 1 Triệu Token |
|---|---|
| Token đầu vào | $1,40 |
| Token đầu vào có cache | $0,26 |
| Token đầu ra | $4,40 |
Giá đầu vào có cache đặc biệt có giá trị cho các workflow tác nhân thường xuyên tham chiếu cùng một ngữ cảnh codebase lớn — ở mức $0,26/MTok, cache giúp tiết kiệm hơn 80% so với yêu cầu không cache.
Ví Dụ Chi Phí Thực Tế
Workflow tác nhân: 10.000 lượt/ngày (2.000 đầu vào + 500 đầu ra token mỗi lượt)
| Mô hình | Chi phí API/ngày |
|---|---|
| GLM 5.2 | ~$23/ngày |
| GPT-5.5 | ~$95/ngày |
| Claude Opus 4.8 | ~$375/ngày |
Xử lý hàng loạt hàng tháng: 10 triệu token (50/50 đầu vào/đầu ra)
| Mô hình | Chi phí/tháng |
|---|---|
| GLM 5.2 | ~$29/tháng |
| GPT-5.5 | ~$175/tháng |
| Claude Opus 4.8 | ~$150/tháng |
Gói Đăng Ký GLM 5.2 (GLM Coding Plan)
Ngoài API tính phí theo token, Z.ai còn cung cấp GLM Coding Plan — gói đăng ký hàng tháng dành cho sử dụng trong các công cụ lập trình (Claude Code, VS Code, Cursor và nhiều IDE khác).
Các Cấp Gói GLM Coding Plan
| Gói | Giá Hàng Tháng (xấp xỉ) | Hạn Mức Sử Dụng | Phù Hợp Với |
|---|---|---|---|
| Lite | ~$10–$18/tháng | ~400 prompt/tuần | Lặp lại nhẹ nhàng trên repo nhỏ |
| Pro | ~$30–$50/tháng | ~2.000 prompt/tuần (5× Lite) | Phát triển hàng ngày trên repo vừa |
| Max | ~$80–$112/tháng | ~8.000 prompt/tuần (20× Lite) | Khối lượng công việc nặng, tài nguyên riêng giờ cao điểm |
| Team | Tính theo chỗ ngồi | Tùy chỉnh | Tổ chức cần thanh toán theo nhóm |
Lưu ý: Thanh toán hàng năm thường được giảm giá ~10–15%. Xem giá hiện tại tại z.ai/subscribe.
Giá GLM 5.2 trên OpenRouter
GLM 5.2 có sẵn trên OpenRouter, với giá thấp hơn một chút so với Z.ai trực tiếp:
| Loại Token | Giá OpenRouter / 1 Triệu Token |
|---|---|
| Đầu vào | $1,00 |
| Đầu vào có cache | $0,26 |
| Đầu ra | $4,00 |
So Sánh Giá GLM 5.2 vs Claude vs GPT-5.5
Bảng so sánh đầy đủ các mô hình frontier hàng đầu (tháng 6/2026):
| Mô hình | Đầu vào ($/MTok) | Đầu ra ($/MTok) | Cửa Sổ Ngữ Cảnh |
|---|---|---|---|
| GLM 5.2 | $1,40 | $4,40 | 1 triệu token |
| GPT-5.5 | $5,00 | $30,00 | 128K token |
| Claude Opus 4.8 | $5,00 | $25,00 | 200K token |
| Gemini 3.1 Pro | ~$3,50 | ~$10,50 | 2 triệu token |
Kết luận chính:
- Token đầu vào GLM 5.2 rẻ hơn 3,6 lần so với Claude Opus 4.8 và GPT-5.5.
- Token đầu ra GLM 5.2 rẻ hơn 5,7 lần so với Claude Opus 4.8 và gần 7 lần so với GPT-5.5.
- Cửa sổ ngữ cảnh 1 triệu token vượt trội so với hầu hết đối thủ với mức giá phải chăng hơn nhiều.
Cách Lấy API Key GLM 5.2
Qua Z.ai (Toàn Cầu)
- Đăng ký tại docs.z.ai.
- Điều hướng đến GLM Coding Plan và chọn gói đăng ký.
- Sau khi đăng ký, tạo API Key trong Individual Coding Plan > Plan Overview.
- Người dùng Team Plan: lấy API Key trong Team Coding Plan > My Plan.
- Đặt Base URL thành
https://api.z.ai/api/coding/paas/v4.
Cài Đặt Nhanh cho Claude Code
# Trợ lý tự động
npx @z_ai/coding-helper
# Hoặc thủ công: chỉnh sửa ~/.claude/settings.json
# Đặt ANTHROPIC_BASE_URL thành https://api.z.ai/api/anthropic
# Đặt ANTHROPIC_AUTH_TOKEN thành API key Z.ai của bạn
GLM 5.2 Có Đáng Giá Tiền Không?
Đối với tác vụ lập trình và tác nhân AI: hoàn toàn đáng. GLM 5.2 được xây dựng chuyên biệt cho kỹ thuật phần mềm dài hạn. Với chi phí chỉ bằng 1/6 GPT-5.5 nhưng đạt kết quả tương đương hoặc vượt trội trên nhiều bài kiểm tra lập trình, giá trị trên mỗi đồng đầu tư là nổi bật.
GLM 5.2 phù hợp khi:
- Chạy tác nhân lập trình khối lượng lớn
- Dự án cần phân tích toàn bộ codebase với 1 triệu token ngữ cảnh
- Nhóm có ngân sách hạn chế cho cơ sở hạ tầng AI
- Tổ chức cần trọng số mở cho tuân thủ hoặc tự host
Khi nên chọn Claude hoặc GPT-5.5:
- Tác vụ suy luận phi lập trình, sáng tạo, hoặc kiến thức chung
- Nhóm đã tích hợp sâu với hệ sinh thái Claude hoặc OpenAI
Câu Hỏi Thường Gặp
GLM 5.2 giá bao nhiêu?
Tính đến tháng 6/2026, giá API GLM 5.2: $1,40/MTok đầu vào, $4,40/MTok đầu ra, $0,26/MTok đầu vào có cache (Z.ai API trực tiếp). Trên OpenRouter: $1,00/MTok đầu vào và $4,00/MTok đầu ra. Gói đăng ký (GLM Coding Plan) bắt đầu từ ~$10–$18/tháng (Lite).
GLM 5.2 có gói miễn phí không?
Có. Người dùng mới trên bigmodel.cn nhận 20 triệu token miễn phí. CLI lập trình Z.ai cũng cung cấp token miễn phí (~300 triệu token đã được báo cáo). Trọng số mô hình đầy đủ miễn phí tải xuống từ Hugging Face theo giấy phép MIT.
API GLM 5.2 tính phí bao nhiêu mỗi token?
Qua Z.ai trực tiếp: $0,0000014 mỗi token đầu vào và $0,0000044 mỗi token đầu ra. Qua OpenRouter: $0,000001 mỗi token đầu vào và $0,000004 mỗi token đầu ra.
GLM 5.2 có rẻ hơn Claude không?
Có, rẻ hơn đáng kể. So với Claude Opus 4.8 ($5/MTok đầu vào, $25/MTok đầu ra), GLM 5.2 rẻ hơn 3,6 lần về đầu vào và 5,7 lần về đầu ra.
Lấy API key GLM 5.2 ở đâu?
Truy cập toàn cầu: đăng ký tại z.ai hoặc làm theo hướng dẫn tại docs.z.ai. Cũng có sẵn qua OpenRouter và Together AI.
GLM 5.2 có API miễn phí không?
Có — tài khoản mới trên bigmodel.cn có 20 triệu token miễn phí. Z.ai cũng cung cấp token khuyến mãi miễn phí cho người dùng CLI lập trình. Trọng số mô hình miễn phí tải xuống từ Hugging Face.
Hướng Dẫn Liên Quan
- GLM 5.2 Có Miễn Phí Không? Tất Cả Cách Truy Cập Miễn Phí
- Đánh Giá GLM 5.2: Benchmark, Điểm Mạnh & Điểm Yếu
- Yêu Cầu Phần Cứng GLM 5.2 Khi Tự Host
Cập nhật lần cuối: 22 tháng 6 năm 2026. Thông tin giá lấy từ tài liệu chính thức Z.ai, OpenRouter và các báo cáo benchmark bên thứ ba. Luôn xác minh giá hiện tại tại z.ai/subscribe và bigmodel.cn/pricing trước khi ra quyết định mua hàng.
Hướng dẫn liên quan
Tiếp tục khám phá cụm nội dung Gemma 4 với bài hướng dẫn tiếp theo phù hợp với quyết định hiện tại của bạn.

Đánh Giá GLM 5.2: Benchmark, Hiệu Năng Code và Có Đáng Dùng Không?
GLM 5.2 ra mắt ngày 13/6/2026 với 744B tham số MoE, cửa sổ ngữ cảnh 1 triệu token, giấy phép MIT và điểm benchmark sánh ngang các mô hình closed-source hàng đầu với chi phí API chỉ bằng khoảng 1/6 GPT-5.5.

GLM 5.2 Có Miễn Phí Không? Tất Cả Cách Dùng Miễn Phí Năm 2026
GLM 5.2 có thể tải xuống và tự host miễn phí theo giấy phép MIT. Bạn cũng có thể dùng thử miễn phí qua Cloudflare Workers AI và z.ai web chat. Hướng dẫn này giải thích tất cả các tùy chọn miễn phí và khi nào cần trả tiền.

Cách Chạy GLM-5.2 trong Ollama: Cloud Tag, Cài Đặt Cục Bộ & Hướng Dẫn API
GLM-5.2 có sẵn trong Ollama qua tag glm-5.2:cloud — một lệnh duy nhất để sử dụng mô hình lập trình 976K ngữ cảnh mà không cần tự tải xuống 744B tham số.
Vẫn chưa biết nên đọc gì tiếp theo?
Quay lại trung tâm hướng dẫn để duyệt các bài so sánh model, hướng dẫn cài đặt và trang lập kế hoạch phần cứng.
