Gemma 4 指南
GLM 5.2 价格详解:API定价、订阅套餐与免费额度(2026)

GLM 5.2 价格详解:API定价、订阅套餐与免费额度(2026)
GLM 5.2 由 Z.ai(原智谱AI)于2026年6月16日正式发布,是一款拥有7440亿参数的混合专家(MoE)模型,专为长上下文编程和智能体任务而设计,支持100万Token上下文窗口,并以MIT开源许可证发布。其定价约为GPT-5.5价格的六分之一,成为目前性价比最高的前沿模型之一。
本指南覆盖截至2026年6月22日的所有GLM 5.2定价选项——API按Token计费、GLM Coding Plan订阅套餐、OpenRouter价格以及免费使用途径。
价格随时可能变动。 请以官方页面 z.ai/subscribe 及 bigmodel.cn/pricing 为准。
快速总结:GLM 5.2 定价一览
| 访问方式 | 价格 |
|---|---|
| API — 输入Token | $1.40 / 百万Token |
| API — 缓存输入Token | $0.26 / 百万Token |
| API — 输出Token | $4.40 / 百万Token |
| OpenRouter — 输入 | $1.00 / 百万Token |
| OpenRouter — 输出 | $4.00 / 百万Token |
| GLM Coding Lite | 约$10–$18/月 |
| GLM Coding Pro | 约$30–$50/月 |
| GLM Coding Max | 约$80–$112/月 |
| 自托管(MIT开源权重) | 免费(仅需硬件成本) |
| 新用户免费Token | 2000万Token(bigmodel.cn) |
GLM 5.2 免费额度
1. 新用户注册赠送(bigmodel.cn,国内推荐)
在 bigmodel.cn(智谱AI开放平台)注册的新用户可获得2000万免费Token资源包,以及120次图像和视频生成额度。这是国内开发者最便捷的免费入口。
2. Z.ai 编程 CLI 免费Token活动(海外)
Z.ai 正在为使用 Z.ai 编程 CLI 的开发者提供大额免费Token(社区反馈约为3亿Token)。资格和数量随时可能调整,请在 z.ai 确认当前政策。
3. 自托管(MIT许可证,完全免费)
由于 GLM 5.2 使用 MIT 开源许可证,你可以从 Hugging Face(zai-org/GLM-5.2)免费下载完整权重并自行部署。注意:GLM 5.2 为744B参数的MoE模型,BF16格式下需要超过1TB显存,仅适合具备大规模GPU基础设施的企业或机构。
4. ZCode 3.0 每日免费额度
智谱推出的 ZCode 3.0 产品为符合资格的用户每天提供300万次免费GLM 5.2额度。详情请查看 open.bigmodel.cn/glm-coding。
GLM 5.2 API 定价
GLM 5.2 独立 API 于2026年6月16日通过 Z.ai 开发者平台正式上线。
Token 费率(2026年6月)
| Token类型 | 每百万Token价格 |
|---|---|
| 输入Token | $1.40 |
| 缓存输入Token | $0.26 |
| 输出Token | $4.40 |
缓存输入价格对于反复引用同一大型代码库上下文的智能体工作流尤为有价值——每百万Token仅需$0.26,比未缓存输入节省80%以上。
实际成本示例
智能体工作流:每天1万次对话(每次2000输入+500输出Token)
| 模型 | 每日API费用 |
|---|---|
| GLM 5.2 | 约$23/天 |
| GPT-5.5 | 约$95/天 |
| Claude Opus 4.8 | 约$375/天 |
月度批量处理:1000万Token(输入/输出各半)
| 模型 | 月费用 |
|---|---|
| GLM 5.2 | 约$29/月 |
| GPT-5.5 | 约$175/月 |
| Claude Opus 4.8 | 约$150/月 |
对于编程任务,输出Token的差距尤为显著:GLM 5.2的输出价格($4.40/百万)比Claude Opus 4.8($25/百万)低5倍以上,比GPT-5.5($30/百万)低近7倍。
GLM 5.2 订阅套餐(GLM Coding Plan)
除按Token计费的API外,Z.ai 还提供 GLM Coding Plan——一种专为编程工具内使用设计的月度订阅方案(支持 Claude Code、VS Code、Cursor 等工具)。GLM 5.2 在全部套餐层级均可使用。
GLM Coding Plan 各档位
| 套餐 | 月价格(约) | 使用配额 | 适合场景 |
|---|---|---|---|
| Lite | 约$10–$18/月 | 约400次提问/周 | 小型代码库的轻量迭代 |
| Pro | 约$30–$50/月 | 约2000次提问/周(Lite的5倍) | 中型项目日常开发 |
| Max | 约$80–$112/月 | 约8000次提问/周(Lite的20倍) | 高强度工作负载,高峰期专属资源 |
| Team | 按席位定价 | 自定义 | 需要团队统一计费的组织 |
注:按年付费通常享有约10–15%的折扣。具体当前价格请查看 z.ai/subscribe,各地区和促销活动价格可能有所不同。
Coding Plan 包含内容
- 访问 GLM 5.2 和 GLM-5-Turbo(用于轻量任务)
- 支持 Claude Code、VS Code、Cursor、Windsurf 等IDE集成
- 按提问次数(而非Token)计费,便于团队管控成本
- Max 和 Team 套餐高峰期享受优先访问权
GLM 5.2 在 OpenRouter 上的价格
GLM 5.2 已上线 OpenRouter,价格略低于 Z.ai 直连 API:
| Token类型 | OpenRouter每百万Token价格 |
|---|---|
| 输入 | $1.00 |
| 缓存输入 | $0.26 |
| 输出 | $4.00 |
如果你已经在使用 OpenRouter 进行多模型路由,通过 OpenRouter 访问 GLM 5.2 可以统一管理密钥,并享受略低的单价。
GLM 5.2 与 Claude、GPT-5.5 价格对比
以下为2026年6月各前沿模型完整价格对比:
| 模型 | 输入($/百万Token) | 输出($/百万Token) | 上下文窗口 |
|---|---|---|---|
| GLM 5.2 | $1.40 | $4.40 | 100万Token |
| GPT-5.5 | $5.00 | $30.00 | 12.8万Token |
| Claude Opus 4.8 | $5.00 | $25.00 | 20万Token |
| Gemini 3.1 Pro | ~$3.50 | ~$10.50 | 200万Token |
核心结论:
- GLM 5.2 输入价格比 Claude Opus 4.8 和 GPT-5.5 便宜3.6倍。
- GLM 5.2 输出价格比 Claude Opus 4.8 便宜5.7倍,比 GPT-5.5 便宜近7倍。
- GLM 5.2 的100万Token上下文窗口是 GPT-5.5 的8倍,却只需其六分之一的价格。
- 在多个编程基准测试(SWE-bench Verified、Codeforces)上,GLM 5.2 超越 GPT-5.5。
如何获取 GLM 5.2 API Key
通过 Z.ai(海外用户)
- 访问 docs.z.ai 注册账号。
- 前往 GLM Coding Plan 页面选择订阅套餐(或选择按Token计费的 API 访问方式)。
- 订阅后,在 Individual Coding Plan > Plan Overview 下生成 API Key。
- Team 套餐用户:在 Team Coding Plan > My Plan 下获取 API Key。
- 将 Base URL 设置为
https://api.z.ai/api/coding/paas/v4。
通过 bigmodel.cn(国内用户推荐)
- 在 open.bigmodel.cn 注册账号(支持国内手机号)。
- 新账号自动获赠2000万免费Token。
- 在控制台生成 API Key。
- 使用标准 OpenAI 兼容格式调用接口。
在 Claude Code 中快速配置
# 自动化助手(推荐)
npx @z_ai/coding-helper
# 或手动编辑 ~/.claude/settings.json:
# 将 ANTHROPIC_BASE_URL 设为 https://api.z.ai/api/anthropic
# 将 ANTHROPIC_AUTH_TOKEN 设为你的 Z.ai API Key
GLM 5.2 性价比分析
对于编程和智能体任务:强烈推荐。 GLM 5.2 专为长上下文软件工程任务打造,以约六分之一的 GPT-5.5 综合成本,在多项编程基准上持平甚至超越后者,性价比极高。
GLM 5.2 适合的场景:
- 大规模编程智能体(SWE-bench 类工作流)
- 需要100万Token上下文的项目(全代码库分析)
- 对AI基础设施成本敏感的团队
- 需要开源权重进行合规或私有化部署的企业
更适合选择 Claude 或 GPT-5.5 的场景:
- 非编程类推理、创意写作或通用知识任务
- 已深度集成 Claude 或 OpenAI 生态的团队
- 不计成本追求绝对最高基准分的场景
总结: 对于以编程为核心的AI应用,GLM 5.2 以中等价位实现了前沿性能,MIT开源证书更为企业提供了私有化部署的选择,是2026年最值得关注的编程模型之一。
常见问题
GLM 5.2 需要多少钱?
截至2026年6月,GLM 5.2 API定价为:输入 $1.40/百万Token,输出 $4.40/百万Token,缓存输入 $0.26/百万Token(Z.ai直连API)。OpenRouter上价格为输入$1.00、输出$4.00。订阅套餐(GLM Coding Plan)最低约$10–$18/月(Lite档)。
GLM 5.2 有免费版吗?
有。在 bigmodel.cn 注册的新用户获赠2000万免费Token。Z.ai 编程CLI也提供大额免费Token活动(约3亿Token)。完整模型权重在 Hugging Face 以MIT许可证免费提供,可自行下载部署。
GLM 5.2 API 每个Token多少钱?
Z.ai直连API:输入每Token约$0.0000014,输出每Token约$0.0000044。OpenRouter:输入每Token约$0.000001,输出每Token约$0.000004。缓存输入每Token约$0.00000026。
GLM 5.2 比 Claude 便宜吗?
是的,便宜很多。与 Claude Opus 4.8(输入$5/百万,输出$25/百万)相比,GLM 5.2 输入便宜3.6倍,输出便宜5.7倍。在高吞吐量的智能体工作流中,节省成本极为可观。
在哪里获取 GLM 5.2 API Key?
海外用户:在 z.ai 注册或按照 docs.z.ai 的快速入门指南操作。国内用户:在 open.bigmodel.cn 注册。也可通过第三方平台 OpenRouter 和 Together AI 访问。
GLM 5.2 有免费API吗?
有。bigmodel.cn 新账号自带2000万Token免费额度。Z.ai也为编程CLI用户提供促销免费Token。免费额度用完后按标准Token费率计费。模型权重本身在 Hugging Face 免费下载。
相关阅读
最后更新:2026年6月22日。价格信息来源于 Z.ai 官方文档、OpenRouter 及第三方基准测试报告。购买前请以 z.ai/subscribe 及 bigmodel.cn/pricing 的最新价格为准。
相关阅读
继续沿着 Gemma 4 内容集群往下读,选一个离你当前决策最近的下一篇。

GLM 5.2 深度评测:性能测试、代码能力与是否值得使用
GLM 5.2 于2026年6月13日正式发布,744B MoE参数、100万Token上下文窗口、MIT开源协议,在多项长任务编码榜单上直追闭源前沿模型,API价格仅为GPT-5.5的约六分之一。本文带你全面了解这个模型。

GLM 5.2 是否免费?2026年所有免费使用方式详解
GLM 5.2 基于MIT开源许可证,可免费下载和自部署。同时,Cloudflare Workers AI和z.ai网页版也提供免费体验。本文详细介绍所有免费使用方式,以及何时需要付费。

如何在 Ollama 中运行 GLM-5.2:Cloud 标签、本地部署与 API 指南
GLM-5.2 已通过 glm-5.2:cloud 标签在 Ollama 中上线——一条命令即可使用 976K 上下文的编程模型,无需自行管理 744B 参数的本地下载。
还没决定下一篇看什么?
回到指南页,按模型对比、本地部署和硬件规划三个方向继续浏览。
