Gemma-4-Leitfäden

GLM 5.2 Preise: API-Kosten, Abonnementpläne & Gratis-Kontingent (2026)

6 Min. Lesezeit
glm 5.2glm 5.2 pricingzhipu aillm pricingai api cost
GLM 5.2 Preise: API-Kosten, Abonnementpläne & Gratis-Kontingent (2026)

GLM 5.2 Preise: API-Kosten, Abonnementpläne & Gratis-Kontingent (2026)

GLM 5.2 wurde am 16. Juni 2026 von Z.ai (ehemals Zhipu AI) veröffentlicht. Es handelt sich um ein 744-Milliarden-Parameter-Mixture-of-Experts-Modell für langfristige Coding- und Agenten-Aufgaben mit einem Kontextfenster von einer Million Token. Das Modell ist unter der MIT-Lizenz verfügbar und kostet rund ein Sechstel des Preises von GPT-5.5 — damit gehört es zu den kosteneffizientesten Frontier-Modellen auf dem Markt.

Dieser Leitfaden deckt alle GLM 5.2-Preisoptionen ab Stand 22. Juni 2026 ab — API-Pay-per-Token-Tarife, GLM Coding Plan-Abonnements, OpenRouter-Preise und kostenlose Zugangswege.

Preise können sich jederzeit ändern. Aktuelle Tarife immer unter z.ai/subscribe und bigmodel.cn/pricing prüfen.


Schnellübersicht: GLM 5.2 Preise auf einen Blick

Zugriffstyp Preis
API — Eingabe $1,40 pro 1 Mio. Token
API — Gecachte Eingabe $0,26 pro 1 Mio. Token
API — Ausgabe $4,40 pro 1 Mio. Token
OpenRouter — Eingabe $1,00 pro 1 Mio. Token
OpenRouter — Ausgabe $4,00 pro 1 Mio. Token
GLM Coding Lite ca. $10–$18/Monat
GLM Coding Pro ca. $30–$50/Monat
GLM Coding Max ca. $80–$112/Monat
Selbst-Hosting (MIT-Gewichte) Kostenlos (nur Hardwarekosten)
Neues-Nutzer-Gratisguthaben 20 Mio. Token (bigmodel.cn)

GLM 5.2 Gratis-Kontingent

1. Neues-Nutzer-Bonus (bigmodel.cn)

Neue Nutzer, die sich auf bigmodel.cn registrieren, erhalten ein kostenloses Kontingent von 20 Millionen Token sowie 120 Bild- und Videogenerierungskredite.

2. Z.ai Gratis-Token-Programm (Entwickler-CLI)

Z.ai bietet Entwicklern, die die Z.ai-Coding-CLI nutzen, ein großzügiges Gratis-Token-Kontingent (Community-Berichte sprechen von ca. 300 Mio. Token). Konditionen und Verfügbarkeit können sich ändern — aktuelle Informationen unter z.ai.

3. Selbst-Hosting (MIT-Lizenz)

Da GLM 5.2 unter der MIT-Lizenz veröffentlicht wurde, können die vollständigen Modellgewichte von Hugging Face (zai-org/GLM-5.2) heruntergeladen und kostenlos selbst betrieben werden. Zu beachten: Das Modell benötigt im BF16-Format über 1 TB GPU-VRAM — praktisch nur für Organisationen mit umfangreicher Infrastruktur.

4. ZCode 3.0 Tagesfreivolumen

Zhipus ZCode 3.0 bietet berechtigten Nutzern täglich 3 Millionen kostenlose GLM 5.2-Token. Details unter open.bigmodel.cn/glm-coding.


GLM 5.2 API-Preise

Die GLM 5.2-Standalone-API ist seit dem 16. Juni 2026 über die Z.ai-Entwicklerplattform verfügbar.

Token-Tarife (Stand Juni 2026)

Token-Typ Preis pro 1 Mio. Token
Eingabe-Token $1,40
Gecachte Eingabe-Token $0,26
Ausgabe-Token $4,40

Der gecachte Eingabepreis ist besonders wertvoll für Agenten-Workflows, die wiederholt denselben großen Codebase-Kontext referenzieren. Bei $0,26/MTok spart Caching über 80 % im Vergleich zu ungecachten Anfragen.

Kostenbeispiele aus der Praxis

Agenten-Workflow: 10.000 Aufrufe/Tag (je 2.000 Eingabe + 500 Ausgabe-Token)

Modell Tägliche API-Kosten
GLM 5.2 ca. $23/Tag
GPT-5.5 ca. $95/Tag
Claude Opus 4.8 ca. $375/Tag

Monatliche Stapelverarbeitung: 10 Mio. Token (50/50 Eingabe/Ausgabe)

Modell Monatskosten
GLM 5.2 ca. $29/Monat
GPT-5.5 ca. $175/Monat
Claude Opus 4.8 ca. $150/Monat

GLM 5.2 Abonnementpläne (GLM Coding Plan)

Neben der Pay-per-Token-API bietet Z.ai den GLM Coding Plan — ein monatliches Flatrate-Abonnement für die Nutzung in unterstützten Coding-Tools (Claude Code, VS Code, Cursor u. a.).

GLM Coding Plan-Tarife

Plan Monatlicher Preis (ca.) Nutzungskontingent Am besten für
Lite ca. $10–$18/Monat ca. 400 Anfragen/Woche Leichtes Iterieren an kleinen Repositories
Pro ca. $30–$50/Monat ca. 2.000 Anfragen/Woche (5× Lite) Tägliche Entwicklung an mittelgroßen Projekten
Max ca. $80–$112/Monat ca. 8.000 Anfragen/Woche (20× Lite) Schwere Workloads, dedizierte Ressourcen
Team Sitzplatz-basierte Preisgestaltung Individuell Unternehmen mit Team-Abrechnung

Hinweis: Jahresabonnements bieten typischerweise ca. 10–15 % Rabatt. Aktuelle Preise und regionale Angebote unter z.ai/subscribe.


GLM 5.2 auf OpenRouter

GLM 5.2 ist auf OpenRouter verfügbar, dort leicht günstiger als direkt über Z.ai:

Token-Typ OpenRouter-Preis pro 1 Mio. Token
Eingabe $1,00
Gecachte Eingabe $0,26
Ausgabe $4,00

GLM 5.2 im Preisvergleich: Claude vs. GPT-5.5

Vollständiger Vergleich der wichtigsten Frontier-Modelle (Stand Juni 2026):

Modell Eingabe ($/MTok) Ausgabe ($/MTok) Kontextfenster
GLM 5.2 $1,40 $4,40 1 Mio. Token
GPT-5.5 $5,00 $30,00 128K Token
Claude Opus 4.8 $5,00 $25,00 200K Token
Gemini 3.1 Pro ~$3,50 ~$10,50 2 Mio. Token

Wichtigste Erkenntnisse:

  • GLM 5.2-Eingabe ist 3,6× günstiger als Claude Opus 4.8 und GPT-5.5.
  • GLM 5.2-Ausgabe ist 5,7× günstiger als Claude Opus 4.8 und 6,8× günstiger als GPT-5.5.
  • 1-Million-Token-Kontextfenster zum Bruchteil des Konkurrenzpreises.

So erhält man einen GLM 5.2 API-Schlüssel

Über Z.ai (Weltweit)

  1. Auf docs.z.ai registrieren.
  2. Zum GLM Coding Plan navigieren und Tarif auswählen.
  3. Nach dem Abonnement unter Individual Coding Plan > Plan Overview einen API-Schlüssel generieren.
  4. Team-Plan-Nutzer: API-Schlüssel unter Team Coding Plan > My Plan abrufen.
  5. Base-URL auf https://api.z.ai/api/coding/paas/v4 setzen.

Schnellkonfiguration für Claude Code

# Automatischer Helfer
npx @z_ai/coding-helper

# Oder manuell: ~/.claude/settings.json bearbeiten
# ANTHROPIC_BASE_URL auf https://api.z.ai/api/anthropic setzen
# ANTHROPIC_AUTH_TOKEN auf den Z.ai-API-Schlüssel setzen

Lohnt sich GLM 5.2?

Für Coding- und Agenten-Aufgaben: Ja, eindeutig. GLM 5.2 wurde speziell für langfristige Software-Engineering-Aufgaben entwickelt. Bei etwa einem Sechstel der Gesamtkosten von GPT-5.5 und vergleichbaren oder besseren Ergebnissen auf mehreren Coding-Benchmarks ist das Preis-Leistungs-Verhältnis für Entwicklungsteams hervorragend.


Häufig gestellte Fragen

Wie viel kostet GLM 5.2?

Stand Juni 2026: $1,40/MTok Eingabe, $4,40/MTok Ausgabe, $0,26/MTok gecachte Eingabe über die direkte Z.ai-API. Auf OpenRouter: $1,00/MTok Eingabe und $4,00/MTok Ausgabe. Abonnementpläne beginnen bei ca. $10–$18/Monat (Lite-Tarif).

Gibt es einen kostenlosen GLM 5.2-Plan?

Ja. Neue Nutzer auf bigmodel.cn erhalten 20 Millionen kostenlose Token. Die Z.ai-Coding-CLI bietet ebenfalls ein großzügiges Gratis-Token-Kontingent (~300 Mio. Token). Die vollständigen Modellgewichte sind auf Hugging Face unter der MIT-Lizenz kostenlos verfügbar.

Wie viel kostet die GLM 5.2 API pro Token?

Über Z.ai direkt: $0,0000014 pro Eingabe-Token und $0,0000044 pro Ausgabe-Token. Über OpenRouter: $0,000001 pro Eingabe-Token und $0,000004 pro Ausgabe-Token.

Ist GLM 5.2 günstiger als Claude?

Ja, erheblich. Im Vergleich zu Claude Opus 4.8 ($5/MTok Eingabe, $25/MTok Ausgabe) ist GLM 5.2 3,6× günstiger bei der Eingabe und 5,7× günstiger bei der Ausgabe.

Wo bekommt man einen GLM 5.2 API-Schlüssel?

Für globalen Zugang: Registrierung auf z.ai oder Schnellstart unter docs.z.ai. Alternativ über OpenRouter oder Together AI.

Hat GLM 5.2 eine kostenlose API?

Ja — neue Konten auf bigmodel.cn erhalten 20 Mio. Token Gratisguthaben. Z.ai bietet ebenfalls ein Promotions-Freivolumen für die Coding-CLI. Die Modellgewichte sind auf Hugging Face kostenlos zum Download verfügbar.


Verwandte Artikel


Zuletzt aktualisiert: 22. Juni 2026. Preisinformationen stammen aus der offiziellen Z.ai-Dokumentation, OpenRouter und Drittanbieter-Berichten. Aktuelle Preise immer unter z.ai/subscribe und bigmodel.cn/pricing prüfen.

Verwandte Leitfäden

Gehen Sie im Gemma-4-Cluster mit dem nächsten Leitfaden weiter, der zu Ihrer aktuellen Entscheidung passt.

Sie wissen noch nicht, was Sie als Nächstes lesen sollen?

Gehen Sie zurück zum Leitfaden-Hub, um Modellvergleiche, Setup-Anleitungen und Seiten zur Hardware-Planung zu durchsuchen.