Guias do Gemma 4

Preços do GLM 5.2: Custo da API, Planos de Assinatura e Gratuito (2026)

6 min de leitura
glm 5.2glm 5.2 pricingzhipu aillm pricingai api cost
Preços do GLM 5.2: Custo da API, Planos de Assinatura e Gratuito (2026)

Preços do GLM 5.2: Custo da API, Planos de Assinatura e Gratuito (2026)

O GLM 5.2 foi lançado pela Z.ai (anteriormente Zhipu AI) em 16 de junho de 2026. É um modelo Mixture-of-Experts (MoE) com 744 bilhões de parâmetros, criado para tarefas de programação de longa duração e fluxos de trabalho de agentes de IA. Suporta uma janela de contexto de 1 milhão de tokens e está disponível sob licença MIT. Com preços em torno de um sexto do custo do GPT-5.5, tornou-se um dos modelos frontier mais competitivos em custo-benefício do mercado.

Este guia cobre todas as opções de preço do GLM 5.2 em 22 de junho de 2026 — tarifas de API por token, assinaturas do GLM Coding Plan, preços no OpenRouter e formas de acesso gratuito.

Os preços podem mudar a qualquer momento. Sempre verifique os valores atuais em z.ai/subscribe e bigmodel.cn/pricing.


Resumo Rápido: Preços do GLM 5.2 em um Olhar

Tipo de Acesso Preço
API — Entrada $1,40 por 1 milhão de tokens
API — Entrada em cache $0,26 por 1 milhão de tokens
API — Saída $4,40 por 1 milhão de tokens
OpenRouter — Entrada $1,00 por 1 milhão de tokens
OpenRouter — Saída $4,00 por 1 milhão de tokens
GLM Coding Lite ~$10–$18/mês
GLM Coding Pro ~$30–$50/mês
GLM Coding Max ~$80–$112/mês
Self-hosting (pesos MIT) Gratuito (apenas custos de hardware)
Tokens gratuitos para novos usuários 20 milhões de tokens (bigmodel.cn)

Plano Gratuito do GLM 5.2

1. Bônus para Novos Usuários (bigmodel.cn)

Novos usuários que se cadastram em bigmodel.cn recebem um pacote gratuito de 20 milhões de tokens mais 120 créditos de geração de imagens e vídeos.

2. Programa de Tokens Gratuitos da Z.ai (CLI de Programação)

A Z.ai está distribuindo uma grande cota de tokens gratuitos para desenvolvedores que utilizam o CLI de programação Z.ai (a comunidade reporta cerca de 300 milhões de tokens). Condições e disponibilidade podem mudar — confirme em z.ai.

3. Self-Hosting (Licença MIT)

Como o GLM 5.2 foi lançado sob licença MIT, você pode baixar os pesos completos do Hugging Face (zai-org/GLM-5.2) e executar o modelo gratuitamente. O detalhe: o modelo MoE de 744B requer mais de 1TB de VRAM de GPU no formato BF16.

4. Cota Diária Gratuita do ZCode 3.0

O ZCode 3.0 da Zhipu oferece 3 milhões de tokens GLM 5.2 gratuitos por dia para usuários elegíveis. Detalhes em open.bigmodel.cn/glm-coding.


Preços da API do GLM 5.2

A API independente do GLM 5.2 entrou em operação em 16 de junho de 2026 pela plataforma de desenvolvimento Z.ai.

Tarifas de Tokens (junho de 2026)

Tipo de Token Preço por 1 Milhão de Tokens
Tokens de entrada $1,40
Tokens de entrada em cache $0,26
Tokens de saída $4,40

O preço de entrada em cache é especialmente valioso para fluxos de agentes que referenciam repetidamente o mesmo contexto de codebase extenso. A $0,26/MTok, o cache reduz os custos de entrada em mais de 80% em comparação com requisições sem cache.

Exemplos de Custos Reais

Fluxo de agente: 10.000 chamadas/dia (2.000 de entrada + 500 de saída por chamada)

Modelo Custo diário da API
GLM 5.2 ~$23/dia
GPT-5.5 ~$95/dia
Claude Opus 4.8 ~$375/dia

Processamento em lote mensal: 10 milhões de tokens (50/50 entrada/saída)

Modelo Custo mensal
GLM 5.2 ~$29/mês
GPT-5.5 ~$175/mês
Claude Opus 4.8 ~$150/mês

Planos de Assinatura do GLM 5.2 (GLM Coding Plan)

Além da API com pagamento por token, a Z.ai oferece o GLM Coding Plan — uma assinatura mensal com valor fixo projetada para uso dentro de ferramentas de programação (Claude Code, VS Code, Cursor e outras IDEs).

Níveis do GLM Coding Plan

Plano Preço Mensal (aprox.) Cota de Uso Melhor Para
Lite ~$10–$18/mês ~400 prompts/semana Iteração leve em repositórios pequenos
Pro ~$30–$50/mês ~2.000 prompts/semana (5× Lite) Desenvolvimento diário em projetos médios
Max ~$80–$112/mês ~8.000 prompts/semana (20× Lite) Cargas de trabalho pesadas, recursos dedicados nos horários de pico
Team Preço por assento Personalizado Organizações que precisam de faturamento por equipe

Nota: A cobrança anual geralmente oferece desconto de ~10–15%. Verifique os preços atuais em z.ai/subscribe.


GLM 5.2 no OpenRouter

O GLM 5.2 está disponível no OpenRouter, com preços ligeiramente inferiores à API direta da Z.ai:

Tipo de Token Preço OpenRouter por 1 Milhão de Tokens
Entrada $1,00
Entrada em cache $0,26
Saída $4,00

GLM 5.2 vs Claude vs GPT-5.5: Comparação de Preços

Comparação completa dos principais modelos frontier em junho de 2026:

Modelo Entrada ($/MTok) Saída ($/MTok) Janela de Contexto
GLM 5.2 $1,40 $4,40 1 milhão de tokens
GPT-5.5 $5,00 $30,00 128K tokens
Claude Opus 4.8 $5,00 $25,00 200K tokens
Gemini 3.1 Pro ~$3,50 ~$10,50 2 milhões de tokens

Principais conclusões:

  • Os tokens de entrada do GLM 5.2 são 3,6× mais baratos que o Claude Opus 4.8 e o GPT-5.5.
  • Os tokens de saída do GLM 5.2 são 5,7× mais baratos que o Claude Opus 4.8 e quase 7× mais baratos que o GPT-5.5.
  • A janela de contexto de 1 milhão de tokens supera a maioria dos concorrentes a uma fração do custo.

Como Obter uma Chave de API do GLM 5.2

Via Z.ai (Global)

  1. Crie uma conta em docs.z.ai.
  2. Navegue até o GLM Coding Plan e selecione um plano de assinatura (ou escolha acesso por API com pagamento por token).
  3. Após assinar, gere sua chave de API em Individual Coding Plan > Plan Overview.
  4. Usuários do Team Plan: encontre sua chave em Team Coding Plan > My Plan.
  5. Configure a URL base para https://api.z.ai/api/coding/paas/v4.

Configuração Rápida para Claude Code

# Assistente automatizado
npx @z_ai/coding-helper

# Ou manualmente: edite ~/.claude/settings.json
# Defina ANTHROPIC_BASE_URL como https://api.z.ai/api/anthropic
# Defina ANTHROPIC_AUTH_TOKEN como sua chave de API Z.ai

O GLM 5.2 Vale o Preço?

Para tarefas de programação e agentes de IA: sim, definitivamente. O GLM 5.2 foi construído especificamente para engenharia de software de longa duração. A aproximadamente um sexto do custo combinado do GPT-5.5, enquanto se iguala ou supera em vários benchmarks de programação, o valor por real investido é excepcional para equipes de desenvolvimento.

Quando o GLM 5.2 faz sentido:

  • Agentes de programação em alto volume (fluxos no estilo SWE-bench)
  • Projetos que requerem contexto de 1 milhão de tokens (análise de codebase completa)
  • Equipes com orçamento limitado para infraestrutura de IA
  • Organizações que querem pesos abertos por motivos de conformidade ou self-hosting

Quando você pode preferir Claude ou GPT-5.5:

  • Tarefas focadas em raciocínio não-codificação, escrita criativa ou conhecimento geral
  • Equipes já profundamente integradas ao ecossistema Claude ou OpenAI

Perguntas Frequentes

Quanto custa o GLM 5.2?

Em junho de 2026, preço da API GLM 5.2: $1,40/MTok entrada, $4,40/MTok saída, $0,26/MTok entrada em cache (API direta Z.ai). No OpenRouter: $1,00/MTok entrada e $4,00/MTok saída. Os planos de assinatura (GLM Coding Plan) começam em aproximadamente $10–$18/mês (plano Lite).

Existe um plano gratuito para o GLM 5.2?

Sim. Novos usuários em bigmodel.cn recebem 20 milhões de tokens gratuitos. O CLI de programação Z.ai também oferece um programa generoso de tokens gratuitos (~300 milhões de tokens reportados). Os pesos completos do modelo estão disponíveis gratuitamente no Hugging Face sob licença MIT.

Quanto custa a API do GLM 5.2 por token?

Via API direta Z.ai: $0,0000014 por token de entrada e $0,0000044 por token de saída. Via OpenRouter: $0,000001 por token de entrada e $0,000004 por token de saída.

O GLM 5.2 é mais barato que o Claude?

Sim, significativamente. Comparado ao Claude Opus 4.8 ($5/MTok entrada, $25/MTok saída), o GLM 5.2 é 3,6× mais barato na entrada e 5,7× mais barato na saída.

Onde posso obter uma chave de API do GLM 5.2?

Para acesso global: cadastre-se em z.ai ou siga o guia de início rápido em docs.z.ai. Também está disponível via OpenRouter e Together AI.

O GLM 5.2 tem uma API gratuita?

Sim — novas contas no bigmodel.cn vêm com 20 milhões de tokens gratuitos. A Z.ai também fornece tokens promocionais gratuitos para usuários do CLI de programação. Os pesos do modelo podem ser baixados gratuitamente do Hugging Face.


Guias Relacionados


Última atualização: 22 de junho de 2026. Informações de preços obtidas da documentação oficial da Z.ai, OpenRouter e relatórios de terceiros. Sempre verifique os preços atuais em z.ai/subscribe e bigmodel.cn/pricing antes de tomar decisões de compra.

Guias relacionados

Continue no cluster do Gemma 4 com o proximo guia que combina com a decisao que voce esta tomando agora.

Ainda decidindo o que ler depois?

Volte para o hub de guias para navegar por comparacoes de modelos, tutoriais de configuracao e paginas de planejamento de hardware.