Guias do Gemma 4
Preços do GLM 5.2: Custo da API, Planos de Assinatura e Gratuito (2026)

Preços do GLM 5.2: Custo da API, Planos de Assinatura e Gratuito (2026)
O GLM 5.2 foi lançado pela Z.ai (anteriormente Zhipu AI) em 16 de junho de 2026. É um modelo Mixture-of-Experts (MoE) com 744 bilhões de parâmetros, criado para tarefas de programação de longa duração e fluxos de trabalho de agentes de IA. Suporta uma janela de contexto de 1 milhão de tokens e está disponível sob licença MIT. Com preços em torno de um sexto do custo do GPT-5.5, tornou-se um dos modelos frontier mais competitivos em custo-benefício do mercado.
Este guia cobre todas as opções de preço do GLM 5.2 em 22 de junho de 2026 — tarifas de API por token, assinaturas do GLM Coding Plan, preços no OpenRouter e formas de acesso gratuito.
Os preços podem mudar a qualquer momento. Sempre verifique os valores atuais em z.ai/subscribe e bigmodel.cn/pricing.
Resumo Rápido: Preços do GLM 5.2 em um Olhar
| Tipo de Acesso | Preço |
|---|---|
| API — Entrada | $1,40 por 1 milhão de tokens |
| API — Entrada em cache | $0,26 por 1 milhão de tokens |
| API — Saída | $4,40 por 1 milhão de tokens |
| OpenRouter — Entrada | $1,00 por 1 milhão de tokens |
| OpenRouter — Saída | $4,00 por 1 milhão de tokens |
| GLM Coding Lite | ~$10–$18/mês |
| GLM Coding Pro | ~$30–$50/mês |
| GLM Coding Max | ~$80–$112/mês |
| Self-hosting (pesos MIT) | Gratuito (apenas custos de hardware) |
| Tokens gratuitos para novos usuários | 20 milhões de tokens (bigmodel.cn) |
Plano Gratuito do GLM 5.2
1. Bônus para Novos Usuários (bigmodel.cn)
Novos usuários que se cadastram em bigmodel.cn recebem um pacote gratuito de 20 milhões de tokens mais 120 créditos de geração de imagens e vídeos.
2. Programa de Tokens Gratuitos da Z.ai (CLI de Programação)
A Z.ai está distribuindo uma grande cota de tokens gratuitos para desenvolvedores que utilizam o CLI de programação Z.ai (a comunidade reporta cerca de 300 milhões de tokens). Condições e disponibilidade podem mudar — confirme em z.ai.
3. Self-Hosting (Licença MIT)
Como o GLM 5.2 foi lançado sob licença MIT, você pode baixar os pesos completos do Hugging Face (zai-org/GLM-5.2) e executar o modelo gratuitamente. O detalhe: o modelo MoE de 744B requer mais de 1TB de VRAM de GPU no formato BF16.
4. Cota Diária Gratuita do ZCode 3.0
O ZCode 3.0 da Zhipu oferece 3 milhões de tokens GLM 5.2 gratuitos por dia para usuários elegíveis. Detalhes em open.bigmodel.cn/glm-coding.
Preços da API do GLM 5.2
A API independente do GLM 5.2 entrou em operação em 16 de junho de 2026 pela plataforma de desenvolvimento Z.ai.
Tarifas de Tokens (junho de 2026)
| Tipo de Token | Preço por 1 Milhão de Tokens |
|---|---|
| Tokens de entrada | $1,40 |
| Tokens de entrada em cache | $0,26 |
| Tokens de saída | $4,40 |
O preço de entrada em cache é especialmente valioso para fluxos de agentes que referenciam repetidamente o mesmo contexto de codebase extenso. A $0,26/MTok, o cache reduz os custos de entrada em mais de 80% em comparação com requisições sem cache.
Exemplos de Custos Reais
Fluxo de agente: 10.000 chamadas/dia (2.000 de entrada + 500 de saída por chamada)
| Modelo | Custo diário da API |
|---|---|
| GLM 5.2 | ~$23/dia |
| GPT-5.5 | ~$95/dia |
| Claude Opus 4.8 | ~$375/dia |
Processamento em lote mensal: 10 milhões de tokens (50/50 entrada/saída)
| Modelo | Custo mensal |
|---|---|
| GLM 5.2 | ~$29/mês |
| GPT-5.5 | ~$175/mês |
| Claude Opus 4.8 | ~$150/mês |
Planos de Assinatura do GLM 5.2 (GLM Coding Plan)
Além da API com pagamento por token, a Z.ai oferece o GLM Coding Plan — uma assinatura mensal com valor fixo projetada para uso dentro de ferramentas de programação (Claude Code, VS Code, Cursor e outras IDEs).
Níveis do GLM Coding Plan
| Plano | Preço Mensal (aprox.) | Cota de Uso | Melhor Para |
|---|---|---|---|
| Lite | ~$10–$18/mês | ~400 prompts/semana | Iteração leve em repositórios pequenos |
| Pro | ~$30–$50/mês | ~2.000 prompts/semana (5× Lite) | Desenvolvimento diário em projetos médios |
| Max | ~$80–$112/mês | ~8.000 prompts/semana (20× Lite) | Cargas de trabalho pesadas, recursos dedicados nos horários de pico |
| Team | Preço por assento | Personalizado | Organizações que precisam de faturamento por equipe |
Nota: A cobrança anual geralmente oferece desconto de ~10–15%. Verifique os preços atuais em z.ai/subscribe.
GLM 5.2 no OpenRouter
O GLM 5.2 está disponível no OpenRouter, com preços ligeiramente inferiores à API direta da Z.ai:
| Tipo de Token | Preço OpenRouter por 1 Milhão de Tokens |
|---|---|
| Entrada | $1,00 |
| Entrada em cache | $0,26 |
| Saída | $4,00 |
GLM 5.2 vs Claude vs GPT-5.5: Comparação de Preços
Comparação completa dos principais modelos frontier em junho de 2026:
| Modelo | Entrada ($/MTok) | Saída ($/MTok) | Janela de Contexto |
|---|---|---|---|
| GLM 5.2 | $1,40 | $4,40 | 1 milhão de tokens |
| GPT-5.5 | $5,00 | $30,00 | 128K tokens |
| Claude Opus 4.8 | $5,00 | $25,00 | 200K tokens |
| Gemini 3.1 Pro | ~$3,50 | ~$10,50 | 2 milhões de tokens |
Principais conclusões:
- Os tokens de entrada do GLM 5.2 são 3,6× mais baratos que o Claude Opus 4.8 e o GPT-5.5.
- Os tokens de saída do GLM 5.2 são 5,7× mais baratos que o Claude Opus 4.8 e quase 7× mais baratos que o GPT-5.5.
- A janela de contexto de 1 milhão de tokens supera a maioria dos concorrentes a uma fração do custo.
Como Obter uma Chave de API do GLM 5.2
Via Z.ai (Global)
- Crie uma conta em docs.z.ai.
- Navegue até o GLM Coding Plan e selecione um plano de assinatura (ou escolha acesso por API com pagamento por token).
- Após assinar, gere sua chave de API em Individual Coding Plan > Plan Overview.
- Usuários do Team Plan: encontre sua chave em Team Coding Plan > My Plan.
- Configure a URL base para
https://api.z.ai/api/coding/paas/v4.
Configuração Rápida para Claude Code
# Assistente automatizado
npx @z_ai/coding-helper
# Ou manualmente: edite ~/.claude/settings.json
# Defina ANTHROPIC_BASE_URL como https://api.z.ai/api/anthropic
# Defina ANTHROPIC_AUTH_TOKEN como sua chave de API Z.ai
O GLM 5.2 Vale o Preço?
Para tarefas de programação e agentes de IA: sim, definitivamente. O GLM 5.2 foi construído especificamente para engenharia de software de longa duração. A aproximadamente um sexto do custo combinado do GPT-5.5, enquanto se iguala ou supera em vários benchmarks de programação, o valor por real investido é excepcional para equipes de desenvolvimento.
Quando o GLM 5.2 faz sentido:
- Agentes de programação em alto volume (fluxos no estilo SWE-bench)
- Projetos que requerem contexto de 1 milhão de tokens (análise de codebase completa)
- Equipes com orçamento limitado para infraestrutura de IA
- Organizações que querem pesos abertos por motivos de conformidade ou self-hosting
Quando você pode preferir Claude ou GPT-5.5:
- Tarefas focadas em raciocínio não-codificação, escrita criativa ou conhecimento geral
- Equipes já profundamente integradas ao ecossistema Claude ou OpenAI
Perguntas Frequentes
Quanto custa o GLM 5.2?
Em junho de 2026, preço da API GLM 5.2: $1,40/MTok entrada, $4,40/MTok saída, $0,26/MTok entrada em cache (API direta Z.ai). No OpenRouter: $1,00/MTok entrada e $4,00/MTok saída. Os planos de assinatura (GLM Coding Plan) começam em aproximadamente $10–$18/mês (plano Lite).
Existe um plano gratuito para o GLM 5.2?
Sim. Novos usuários em bigmodel.cn recebem 20 milhões de tokens gratuitos. O CLI de programação Z.ai também oferece um programa generoso de tokens gratuitos (~300 milhões de tokens reportados). Os pesos completos do modelo estão disponíveis gratuitamente no Hugging Face sob licença MIT.
Quanto custa a API do GLM 5.2 por token?
Via API direta Z.ai: $0,0000014 por token de entrada e $0,0000044 por token de saída. Via OpenRouter: $0,000001 por token de entrada e $0,000004 por token de saída.
O GLM 5.2 é mais barato que o Claude?
Sim, significativamente. Comparado ao Claude Opus 4.8 ($5/MTok entrada, $25/MTok saída), o GLM 5.2 é 3,6× mais barato na entrada e 5,7× mais barato na saída.
Onde posso obter uma chave de API do GLM 5.2?
Para acesso global: cadastre-se em z.ai ou siga o guia de início rápido em docs.z.ai. Também está disponível via OpenRouter e Together AI.
O GLM 5.2 tem uma API gratuita?
Sim — novas contas no bigmodel.cn vêm com 20 milhões de tokens gratuitos. A Z.ai também fornece tokens promocionais gratuitos para usuários do CLI de programação. Os pesos do modelo podem ser baixados gratuitamente do Hugging Face.
Guias Relacionados
- O GLM 5.2 é Gratuito? Todas as Opções de Acesso Gratuito Explicadas
- Análise do GLM 5.2: Benchmarks, Pontos Fortes e Fracos
- Requisitos de Hardware do GLM 5.2 para Self-Hosting
Última atualização: 22 de junho de 2026. Informações de preços obtidas da documentação oficial da Z.ai, OpenRouter e relatórios de terceiros. Sempre verifique os preços atuais em z.ai/subscribe e bigmodel.cn/pricing antes de tomar decisões de compra.
Guias relacionados
Continue no cluster do Gemma 4 com o proximo guia que combina com a decisao que voce esta tomando agora.

GLM 5.2 Review: Benchmarks, Performance em Código e Vale a Pena Usar?
O GLM 5.2 foi lançado em 13 de junho de 2026 com 744B parâmetros MoE, janela de contexto de 1 milhão de tokens, licença MIT e pontuações em benchmarks que rivalizam com os melhores modelos closed-source a cerca de um sexto do custo de API do GPT-5.5.

GLM 5.2 é Gratuito? Todas as Formas de Usar de Graça em 2026
O GLM 5.2 pode ser baixado e auto-hospedado gratuitamente sob a licença MIT. Também é possível experimentar de graça via Cloudflare Workers AI e z.ai web chat. Este guia explica todas as opções gratuitas e quando a cobrança começa.

Como Executar o GLM-5.2 no Ollama: Tag Cloud, Configuração Local e Guia da API
O GLM-5.2 está disponível no Ollama via tag glm-5.2:cloud — um único comando para usar um modelo de programação com contexto de 976K sem precisar gerenciar um download de 744B de parâmetros.
Ainda decidindo o que ler depois?
Volte para o hub de guias para navegar por comparacoes de modelos, tutoriais de configuracao e paginas de planejamento de hardware.
