Hướng dẫn Gemma 4
GLM 5.2 Có Miễn Phí Không? Tất Cả Cách Dùng Miễn Phí Năm 2026

Trả Lời Ngắn Gọn: GLM 5.2 Có Miễn Phí Không?
Có — GLM 5.2 miễn phí theo nhiều cách khác nhau.
- Trọng số mô hình được phát hành theo giấy phép MIT và có sẵn miễn phí trên Hugging Face.
- Cloudflare Workers AI host GLM 5.2 trong LLM Playground không cần đăng ký, không cần thanh toán.
- Z.ai web chat có gói miễn phí cho hội thoại thông thường và các tác vụ lập trình nhẹ.
- Ollama có tag
glm-5.2:cloudchạy suy luận qua Ollama Cloud GPU. - Tự host bằng llama.cpp hoặc vLLM sau khi tải xuống trọng số là hoàn toàn miễn phí mãi mãi.
Điều không miễn phí: Gọi API trực tiếp đến endpoint sản xuất của z.ai — $1,40 trên 1 triệu token đầu vào và $4,40 trên 1 triệu token đầu ra (tính đến tháng 6 năm 2026). Gói đăng ký GLM Coding Plan bắt đầu từ khoảng $3–6/tháng cho gói Lite.
Các Cách Sử Dụng GLM 5.2 Miễn Phí
1. Z.ai Web Chat (Gói Miễn Phí)
Truy cập z.ai và bắt đầu trò chuyện. Gói miễn phí không yêu cầu thẻ tín dụng và phù hợp cho hội thoại hàng ngày, hỏi đáp và các tác vụ lập trình nhẹ. Có giới hạn tần suất yêu cầu — kiểm tra hạn mức hiện tại trên z.ai vì có thể thay đổi.
2. Cloudflare Workers AI Playground (Không Cần Đăng Ký)
Workers AI LLM Playground của Cloudflare host GLM 5.2 mà không cần tài khoản hay xác thực. Mở trang, nhập câu hỏi, nhận phản hồi ngay lập tức — cách nhanh nhất để test mô hình không cần thiết lập gì.
3. Ollama (Tag glm-5.2:cloud)
Với Ollama đã cài đặt, tag glm-5.2:cloud chuyển hướng suy luận đến Ollama Cloud GPU thay vì máy local:
ollama run glm-5.2:cloud
Không cần VRAM local khổng lồ. Kiểm tra tag mới nhất và giới hạn sử dụng tại ollama.com/library/glm-5.2.
4. Hugging Face Inference Providers (Cửa Sổ Miễn Phí Có Hạn)
Ngay sau khi phát hành vào tháng 6 năm 2026, Hugging Face mở cửa sổ suy luận miễn phí qua Inference Providers. Xem trạng thái hiện tại trên trang mô hình zai-org/GLM-5.2.
5. Puter.js (Miễn Phí, Không Cần Backend)
Puter.js cho phép truy cập miễn phí vào các mô hình Z.ai GLM từ phía trình duyệt mà không cần API key hay đăng ký backend. Có một số giới hạn tần suất nhưng không cần thiết lập gì.
6. Tự Host Trọng Số Theo Giấy Phép MIT
Tải xuống trọng số từ Hugging Face (zai-org/GLM-5.2) và chạy local với llama.cpp, vLLM hoặc LM Studio. Sau khi tải xuống, không bao giờ phát sinh chi phí token. Yêu cầu phần cứng cao: mô hình độ chính xác đầy đủ khoảng 1,51 TB. Các phiên bản GGUF được lượng tử hóa từ unsloth/GLM-5.2-GGUF giảm đáng kể kích thước (lượng tử hóa 2-bit nhỏ nhất cần khoảng 241 GB VRAM).
GLM 5.2 Có Phải Mã Nguồn Mở Không?
Có. GLM 5.2 là mô hình mở trọng số (open-weight) và được phát hành theo giấy phép MIT.
Giấy phép MIT là một trong những giấy phép mã nguồn mở thoáng nhất, cho phép bạn:
- Tải xuống, sử dụng và chỉnh sửa trọng số mô hình miễn phí
- Fine-tune mô hình cho mục đích của bạn
- Triển khai thương mại mà không cần trả tiền bản quyền
- Phân phối lại hoặc cấp phép lại
Không giới hạn vùng — trọng số có sẵn toàn cầu, không có khóa địa lý.
Trọng số mô hình được host tại:
- Hugging Face:
zai-org/GLM-5.2 - ModelScope (cho người dùng tại Trung Quốc)
"Mở trọng số" vs "mã nguồn mở đầy đủ": Trọng số và giấy phép hoàn toàn mở. Một số thảo luận phân biệt "open-weight" (phát hành trọng số) và "mã nguồn mở đầy đủ" (cũng phát hành dữ liệu huấn luyện và code). Code suy luận và trọng số mô hình GLM 5.2 đều có sẵn tự do; chi tiết đầy đủ về cơ sở hạ tầng huấn luyện có thể chưa được công bố hoàn toàn.
Giới Hạn Của Gói Miễn Phí GLM 5.2
| Phương thức truy cập | Chi phí | Giới hạn |
|---|---|---|
| Z.ai web chat | Miễn phí | Giới hạn tần suất; kiểm tra hạn mức trên z.ai |
| Cloudflare Workers AI Playground | Miễn phí | Chỉ để test; không dùng cho production |
| Ollama glm-5.2:cloud | Miễn phí (Ollama Cloud) | Theo chính sách sử dụng Ollama Cloud |
| Hugging Face Inference Providers | Miễn phí (có hạn) | Có thể hết hạn hoặc bị throttle |
| Puter.js | Miễn phí | Giới hạn tần suất theo app |
| Tự host | Miễn phí mãi mãi | Bị giới hạn bởi phần cứng của bạn |
Đối với ứng dụng sản xuất với khối lượng lớn, các gói miễn phí thường không đủ.
GLM 5.2 API Miễn Phí
Có API GLM 5.2 Miễn Phí Không?
Không có API miễn phí vĩnh viễn, không giới hạn từ Z.ai. Tuy nhiên có một số tùy chọn gần miễn phí:
- Credits cho người dùng mới: Z.ai cấp credits miễn phí khi đăng ký tài khoản mới. Số lượng chính xác có thể thay đổi — kiểm tra docs.z.ai khi đăng ký.
- Hạn mức miễn phí của Z.ai Coding CLI: Z.ai đã cấp hạn mức token miễn phí lớn cho coding CLI (báo cáo cộng đồng đề cập khoảng 300 triệu token) để thu hút developer. Điều kiện và hạn mức có thể thay đổi.
- Cloudflare Workers AI: Miễn phí để test nhưng không phù hợp cho production.
- Puter.js: Cung cấp giao diện giống API không cần key cho các ứng dụng trình duyệt.
Giá API Trả Phí (Tính Đến Tháng 6 Năm 2026)
- Token đầu vào: $1,40 trên 1 triệu token
- Token đầu ra: $4,40 trên 1 triệu token
- Đầu vào được cache: Giảm đáng kể với prompt caching (tỷ lệ cache chính xác xem tại docs.z.ai)
GLM 5.2 rẻ hơn khoảng 1/6 so với các mô hình frontier như GPT-5.5. Luôn xác nhận giá chính thức tại docs.z.ai/guides/overview/pricing.
Cách Lấy API Key Z.ai
- Truy cập z.ai và tạo tài khoản
- Điều hướng đến phần quản lý API key
- Tạo key mới
- Sử dụng với endpoint tương thích OpenAI (API tương thích với định dạng chat completions của OpenAI)
Khi Nào Cần Trả Phí?
Bạn nên xem xét gói trả phí khi:
- Cần truy cập API production vượt quá credits dùng thử miễn phí
- Ứng dụng cần khối lượng yêu cầu cao vượt giới hạn tần suất gói miễn phí
- Dùng GLM 5.2 trong IDE lập trình (Cursor, Cline, Claude Code) — GLM Coding Plans được thiết kế cho mục đích này
- Cần đảm bảo SLA hoặc thông lượng ưu tiên
- Không có phần cứng để tự host nhưng cần uptime ổn định
Nếu chỉ đánh giá mô hình, các tùy chọn miễn phí (đặc biệt Cloudflare và gói miễn phí z.ai) là quá đủ.
Hướng Dẫn Từng Bước: Dùng GLM 5.2 Miễn Phí
Cách nhanh nhất không cần tài khoản và không cần tải xuống.
Phương Pháp A: Cloudflare Workers AI (Không Cần Thiết Lập, Khuyên Dùng Để Test)
- Mở trình duyệt và truy cập developers.cloudflare.com/workers-ai/models/glm-5.2/
- Tìm phần "LLM Playground" trên trang
- Nhập câu hỏi vào ô nhập liệu
- Nhấp "Run" hoặc nhấn Enter
- Đọc phản hồi — không cần đăng nhập, không cần thẻ tín dụng
Phương Pháp B: Z.ai Web Chat (Gói Miễn Phí, Tốt Nhất Cho Sử Dụng Liên Tục)
- Truy cập z.ai
- Tạo tài khoản miễn phí (đăng ký bằng email, không cần thẻ tín dụng)
- Chọn mô hình GLM 5.2 trong bộ chọn mô hình
- Bắt đầu trò chuyện
Phương Pháp C: Ollama Cloud Tag (Dành Cho Developer)
- Cài đặt Ollama:
curl -fsSL https://ollama.com/install.sh | sh - Tải mô hình được host trên cloud:
ollama run glm-5.2:cloud - Nhập câu hỏi và nhấn Enter
- Sử dụng endpoint API local tại
http://localhost:11434trong ứng dụng
Phương Pháp D: Tự Host Với llama.cpp (Kiểm Soát Tối Đa)
- Cài đặt llama.cpp: xem hướng dẫn tại github.com/ggml-org/llama.cpp
- Tải xuống GGUF được lượng tử hóa từ huggingface.co/unsloth/GLM-5.2-GGUF (chọn kích thước phù hợp với VRAM của bạn)
- Chạy:
llama-server -m GLM-5.2-Q2_K.gguf --host 0.0.0.0 --port 8080 - Gọi API local tại
http://localhost:8080— hoàn toàn miễn phí, mãi mãi
Câu Hỏi Thường Gặp
GLM 5.2 có miễn phí không?
Một phần miễn phí. Trọng số GLM 5.2 theo giấy phép MIT, có thể tải xuống và tự host miễn phí; Cloudflare Workers AI Playground cho phép test miễn phí (không cần đăng ký); z.ai web chat có gói miễn phí. Gọi API trực tiếp đến z.ai là trả phí (tháng 6 năm 2026: đầu vào $1,40/triệu token, đầu ra $4,40/triệu token).
GLM 5.2 có phải mã nguồn mở không?
Có. GLM 5.2 được phát hành theo giấy phép MIT — một trong những giấy phép mã nguồn mở thoáng nhất. Bạn có thể tải xuống, chỉnh sửa, fine-tune và triển khai thương mại trọng số mô hình miễn phí, không có phí bản quyền và không giới hạn vùng. Trọng số được host tại zai-org/GLM-5.2 trên Hugging Face.
Tôi có thể dùng GLM 5.2 mà không cần đăng ký không?
Có. Cloudflare Workers AI LLM Playground cho phép chạy GLM 5.2 trực tiếp trên trình duyệt không cần tài khoản. Puter.js cũng cung cấp truy cập API dựa trên trình duyệt không cần key. Để sử dụng liên tục, tài khoản z.ai miễn phí mang lại nhiều tính năng hơn.
Có API GLM 5.2 miễn phí không?
Không có API vĩnh viễn không giới hạn. Z.ai cấp cho người dùng mới một số credits miễn phí khi đăng ký. Để có API hoàn toàn miễn phí không giới hạn tần suất, tự host trọng số theo giấy phép MIT là giải pháp duy nhất vĩnh viễn.
Cách dùng GLM 5.2 miễn phí?
Cách đơn giản nhất: truy cập developers.cloudflare.com/workers-ai/models/glm-5.2/ và sử dụng LLM Playground — không cần đăng ký. Để sử dụng miễn phí liên tục, tạo tài khoản miễn phí tại z.ai. Để developer dùng không tốn chi phí token, tải xuống trọng số từ Hugging Face và chạy local với llama.cpp hoặc Ollama.
Giới hạn của gói miễn phí GLM 5.2 là gì?
Gói miễn phí z.ai web chat có giới hạn tần suất (con số cụ thể có thể thay đổi — kiểm tra z.ai). Cloudflare Playground chỉ để test, không phải production API. Credits người dùng mới có hạn. Tự host về mặt kỹ thuật là không giới hạn nhưng đòi hỏi phần cứng đáng kể (tối thiểu khoảng 241 GB VRAM cho phiên bản lượng tử hóa nhỏ nhất).
Hướng Dẫn Liên Quan
Hướng dẫn liên quan
Tiếp tục khám phá cụm nội dung Gemma 4 với bài hướng dẫn tiếp theo phù hợp với quyết định hiện tại của bạn.

Giá GLM 5.2: Chi Phí API, Gói Đăng Ký & Miễn Phí (2026)
Hướng dẫn đầy đủ về giá GLM 5.2 năm 2026: chi phí API theo token, các gói đăng ký GLM Coding Plan (Lite/Pro/Max/Team), giá OpenRouter và cách truy cập miễn phí.

Đánh Giá GLM 5.2: Benchmark, Hiệu Năng Code và Có Đáng Dùng Không?
GLM 5.2 ra mắt ngày 13/6/2026 với 744B tham số MoE, cửa sổ ngữ cảnh 1 triệu token, giấy phép MIT và điểm benchmark sánh ngang các mô hình closed-source hàng đầu với chi phí API chỉ bằng khoảng 1/6 GPT-5.5.

Cách Chạy GLM-5.2 trong Ollama: Cloud Tag, Cài Đặt Cục Bộ & Hướng Dẫn API
GLM-5.2 có sẵn trong Ollama qua tag glm-5.2:cloud — một lệnh duy nhất để sử dụng mô hình lập trình 976K ngữ cảnh mà không cần tự tải xuống 744B tham số.
Vẫn chưa biết nên đọc gì tiếp theo?
Quay lại trung tâm hướng dẫn để duyệt các bài so sánh model, hướng dẫn cài đặt và trang lập kế hoạch phần cứng.
