Hướng dẫn Gemma 4

Giá GLM 5.2: Chi Phí API, Gói Đăng Ký & Miễn Phí (2026)

Đọc trong 6 phút
glm 5.2glm 5.2 pricingzhipu aillm pricingai api cost
Giá GLM 5.2: Chi Phí API, Gói Đăng Ký & Miễn Phí (2026)

Giá GLM 5.2: Chi Phí API, Gói Đăng Ký & Miễn Phí (2026)

GLM 5.2 được Z.ai (trước đây là Zhipu AI) phát hành vào ngày 16 tháng 6 năm 2026, là mô hình Mixture-of-Experts (MoE) với 744 tỷ tham số, được xây dựng cho các tác vụ lập trình dài hạn và tác nhân AI. Mô hình hỗ trợ cửa sổ ngữ cảnh 1 triệu token và được cấp phép MIT. Với mức giá chỉ bằng khoảng 1/6 GPT-5.5, đây là một trong những mô hình frontier tiết kiệm chi phí nhất hiện nay.

Hướng dẫn này bao gồm tất cả các tùy chọn giá GLM 5.2 tính đến ngày 22 tháng 6 năm 2026 — giá API theo token, gói đăng ký GLM Coding Plan, giá OpenRouter và các cách truy cập miễn phí.

Giá có thể thay đổi bất kỳ lúc nào. Luôn kiểm tra giá hiện tại tại z.ai/subscribebigmodel.cn/pricing.


Tổng Quan Nhanh: Bảng Giá GLM 5.2

Loại Truy Cập Giá
API — Đầu vào $1,40 / triệu token
API — Đầu vào có cache $0,26 / triệu token
API — Đầu ra $4,40 / triệu token
OpenRouter — Đầu vào $1,00 / triệu token
OpenRouter — Đầu ra $4,00 / triệu token
GLM Coding Lite ~$10–$18/tháng
GLM Coding Pro ~$30–$50/tháng
GLM Coding Max ~$80–$112/tháng
Tự host (trọng số MIT) Miễn phí (chỉ tốn phần cứng)
Token miễn phí người dùng mới 20 triệu token (bigmodel.cn)

Gói Miễn Phí GLM 5.2

1. Bonus Người Dùng Mới (bigmodel.cn)

Người dùng mới đăng ký tại bigmodel.cn nhận được 20 triệu token miễn phí cùng 120 lần tạo ảnh và video.

2. Chương Trình Token Miễn Phí Z.ai (CLI Lập Trình)

Z.ai đang cung cấp lượng token miễn phí lớn cho các nhà phát triển sử dụng Z.ai coding CLI (cộng đồng báo cáo khoảng 300 triệu token). Điều kiện và hạn ngạch có thể thay đổi — xác nhận tại z.ai.

3. Tự Host (Giấy Phép MIT)

Vì GLM 5.2 được phát hành theo giấy phép MIT, bạn có thể tải toàn bộ trọng số từ Hugging Face (zai-org/GLM-5.2) và chạy hoàn toàn miễn phí. Lưu ý: mô hình MoE 744B cần hơn 1TB VRAM GPU ở định dạng BF16.

4. Hạn Ngạch Miễn Phí Hàng Ngày của ZCode 3.0

ZCode 3.0 của Zhipu cung cấp 3 triệu token GLM 5.2 miễn phí mỗi ngày cho người dùng đủ điều kiện. Chi tiết tại open.bigmodel.cn/glm-coding.


Giá API GLM 5.2

API độc lập GLM 5.2 ra mắt ngày 16 tháng 6 năm 2026 qua nền tảng dành cho nhà phát triển Z.ai.

Giá Token (Tháng 6/2026)

Loại Token Giá / 1 Triệu Token
Token đầu vào $1,40
Token đầu vào có cache $0,26
Token đầu ra $4,40

Giá đầu vào có cache đặc biệt có giá trị cho các workflow tác nhân thường xuyên tham chiếu cùng một ngữ cảnh codebase lớn — ở mức $0,26/MTok, cache giúp tiết kiệm hơn 80% so với yêu cầu không cache.

Ví Dụ Chi Phí Thực Tế

Workflow tác nhân: 10.000 lượt/ngày (2.000 đầu vào + 500 đầu ra token mỗi lượt)

Mô hình Chi phí API/ngày
GLM 5.2 ~$23/ngày
GPT-5.5 ~$95/ngày
Claude Opus 4.8 ~$375/ngày

Xử lý hàng loạt hàng tháng: 10 triệu token (50/50 đầu vào/đầu ra)

Mô hình Chi phí/tháng
GLM 5.2 ~$29/tháng
GPT-5.5 ~$175/tháng
Claude Opus 4.8 ~$150/tháng

Gói Đăng Ký GLM 5.2 (GLM Coding Plan)

Ngoài API tính phí theo token, Z.ai còn cung cấp GLM Coding Plan — gói đăng ký hàng tháng dành cho sử dụng trong các công cụ lập trình (Claude Code, VS Code, Cursor và nhiều IDE khác).

Các Cấp Gói GLM Coding Plan

Gói Giá Hàng Tháng (xấp xỉ) Hạn Mức Sử Dụng Phù Hợp Với
Lite ~$10–$18/tháng ~400 prompt/tuần Lặp lại nhẹ nhàng trên repo nhỏ
Pro ~$30–$50/tháng ~2.000 prompt/tuần (5× Lite) Phát triển hàng ngày trên repo vừa
Max ~$80–$112/tháng ~8.000 prompt/tuần (20× Lite) Khối lượng công việc nặng, tài nguyên riêng giờ cao điểm
Team Tính theo chỗ ngồi Tùy chỉnh Tổ chức cần thanh toán theo nhóm

Lưu ý: Thanh toán hàng năm thường được giảm giá ~10–15%. Xem giá hiện tại tại z.ai/subscribe.


Giá GLM 5.2 trên OpenRouter

GLM 5.2 có sẵn trên OpenRouter, với giá thấp hơn một chút so với Z.ai trực tiếp:

Loại Token Giá OpenRouter / 1 Triệu Token
Đầu vào $1,00
Đầu vào có cache $0,26
Đầu ra $4,00

So Sánh Giá GLM 5.2 vs Claude vs GPT-5.5

Bảng so sánh đầy đủ các mô hình frontier hàng đầu (tháng 6/2026):

Mô hình Đầu vào ($/MTok) Đầu ra ($/MTok) Cửa Sổ Ngữ Cảnh
GLM 5.2 $1,40 $4,40 1 triệu token
GPT-5.5 $5,00 $30,00 128K token
Claude Opus 4.8 $5,00 $25,00 200K token
Gemini 3.1 Pro ~$3,50 ~$10,50 2 triệu token

Kết luận chính:

  • Token đầu vào GLM 5.2 rẻ hơn 3,6 lần so với Claude Opus 4.8 và GPT-5.5.
  • Token đầu ra GLM 5.2 rẻ hơn 5,7 lần so với Claude Opus 4.8 và gần 7 lần so với GPT-5.5.
  • Cửa sổ ngữ cảnh 1 triệu token vượt trội so với hầu hết đối thủ với mức giá phải chăng hơn nhiều.

Cách Lấy API Key GLM 5.2

Qua Z.ai (Toàn Cầu)

  1. Đăng ký tại docs.z.ai.
  2. Điều hướng đến GLM Coding Plan và chọn gói đăng ký.
  3. Sau khi đăng ký, tạo API Key trong Individual Coding Plan > Plan Overview.
  4. Người dùng Team Plan: lấy API Key trong Team Coding Plan > My Plan.
  5. Đặt Base URL thành https://api.z.ai/api/coding/paas/v4.

Cài Đặt Nhanh cho Claude Code

# Trợ lý tự động
npx @z_ai/coding-helper

# Hoặc thủ công: chỉnh sửa ~/.claude/settings.json
# Đặt ANTHROPIC_BASE_URL thành https://api.z.ai/api/anthropic
# Đặt ANTHROPIC_AUTH_TOKEN thành API key Z.ai của bạn

GLM 5.2 Có Đáng Giá Tiền Không?

Đối với tác vụ lập trình và tác nhân AI: hoàn toàn đáng. GLM 5.2 được xây dựng chuyên biệt cho kỹ thuật phần mềm dài hạn. Với chi phí chỉ bằng 1/6 GPT-5.5 nhưng đạt kết quả tương đương hoặc vượt trội trên nhiều bài kiểm tra lập trình, giá trị trên mỗi đồng đầu tư là nổi bật.

GLM 5.2 phù hợp khi:

  • Chạy tác nhân lập trình khối lượng lớn
  • Dự án cần phân tích toàn bộ codebase với 1 triệu token ngữ cảnh
  • Nhóm có ngân sách hạn chế cho cơ sở hạ tầng AI
  • Tổ chức cần trọng số mở cho tuân thủ hoặc tự host

Khi nên chọn Claude hoặc GPT-5.5:

  • Tác vụ suy luận phi lập trình, sáng tạo, hoặc kiến thức chung
  • Nhóm đã tích hợp sâu với hệ sinh thái Claude hoặc OpenAI

Câu Hỏi Thường Gặp

GLM 5.2 giá bao nhiêu?

Tính đến tháng 6/2026, giá API GLM 5.2: $1,40/MTok đầu vào, $4,40/MTok đầu ra, $0,26/MTok đầu vào có cache (Z.ai API trực tiếp). Trên OpenRouter: $1,00/MTok đầu vào và $4,00/MTok đầu ra. Gói đăng ký (GLM Coding Plan) bắt đầu từ ~$10–$18/tháng (Lite).

GLM 5.2 có gói miễn phí không?

Có. Người dùng mới trên bigmodel.cn nhận 20 triệu token miễn phí. CLI lập trình Z.ai cũng cung cấp token miễn phí (~300 triệu token đã được báo cáo). Trọng số mô hình đầy đủ miễn phí tải xuống từ Hugging Face theo giấy phép MIT.

API GLM 5.2 tính phí bao nhiêu mỗi token?

Qua Z.ai trực tiếp: $0,0000014 mỗi token đầu vào và $0,0000044 mỗi token đầu ra. Qua OpenRouter: $0,000001 mỗi token đầu vào và $0,000004 mỗi token đầu ra.

GLM 5.2 có rẻ hơn Claude không?

Có, rẻ hơn đáng kể. So với Claude Opus 4.8 ($5/MTok đầu vào, $25/MTok đầu ra), GLM 5.2 rẻ hơn 3,6 lần về đầu vào5,7 lần về đầu ra.

Lấy API key GLM 5.2 ở đâu?

Truy cập toàn cầu: đăng ký tại z.ai hoặc làm theo hướng dẫn tại docs.z.ai. Cũng có sẵn qua OpenRouterTogether AI.

GLM 5.2 có API miễn phí không?

Có — tài khoản mới trên bigmodel.cn có 20 triệu token miễn phí. Z.ai cũng cung cấp token khuyến mãi miễn phí cho người dùng CLI lập trình. Trọng số mô hình miễn phí tải xuống từ Hugging Face.


Hướng Dẫn Liên Quan


Cập nhật lần cuối: 22 tháng 6 năm 2026. Thông tin giá lấy từ tài liệu chính thức Z.ai, OpenRouter và các báo cáo benchmark bên thứ ba. Luôn xác minh giá hiện tại tại z.ai/subscribebigmodel.cn/pricing trước khi ra quyết định mua hàng.

Hướng dẫn liên quan

Tiếp tục khám phá cụm nội dung Gemma 4 với bài hướng dẫn tiếp theo phù hợp với quyết định hiện tại của bạn.

Vẫn chưa biết nên đọc gì tiếp theo?

Quay lại trung tâm hướng dẫn để duyệt các bài so sánh model, hướng dẫn cài đặt và trang lập kế hoạch phần cứng.