Gemma-4-Leitfäden
GLM 5.2 Preise: API-Kosten, Abonnementpläne & Gratis-Kontingent (2026)

GLM 5.2 Preise: API-Kosten, Abonnementpläne & Gratis-Kontingent (2026)
GLM 5.2 wurde am 16. Juni 2026 von Z.ai (ehemals Zhipu AI) veröffentlicht. Es handelt sich um ein 744-Milliarden-Parameter-Mixture-of-Experts-Modell für langfristige Coding- und Agenten-Aufgaben mit einem Kontextfenster von einer Million Token. Das Modell ist unter der MIT-Lizenz verfügbar und kostet rund ein Sechstel des Preises von GPT-5.5 — damit gehört es zu den kosteneffizientesten Frontier-Modellen auf dem Markt.
Dieser Leitfaden deckt alle GLM 5.2-Preisoptionen ab Stand 22. Juni 2026 ab — API-Pay-per-Token-Tarife, GLM Coding Plan-Abonnements, OpenRouter-Preise und kostenlose Zugangswege.
Preise können sich jederzeit ändern. Aktuelle Tarife immer unter z.ai/subscribe und bigmodel.cn/pricing prüfen.
Schnellübersicht: GLM 5.2 Preise auf einen Blick
| Zugriffstyp | Preis |
|---|---|
| API — Eingabe | $1,40 pro 1 Mio. Token |
| API — Gecachte Eingabe | $0,26 pro 1 Mio. Token |
| API — Ausgabe | $4,40 pro 1 Mio. Token |
| OpenRouter — Eingabe | $1,00 pro 1 Mio. Token |
| OpenRouter — Ausgabe | $4,00 pro 1 Mio. Token |
| GLM Coding Lite | ca. $10–$18/Monat |
| GLM Coding Pro | ca. $30–$50/Monat |
| GLM Coding Max | ca. $80–$112/Monat |
| Selbst-Hosting (MIT-Gewichte) | Kostenlos (nur Hardwarekosten) |
| Neues-Nutzer-Gratisguthaben | 20 Mio. Token (bigmodel.cn) |
GLM 5.2 Gratis-Kontingent
1. Neues-Nutzer-Bonus (bigmodel.cn)
Neue Nutzer, die sich auf bigmodel.cn registrieren, erhalten ein kostenloses Kontingent von 20 Millionen Token sowie 120 Bild- und Videogenerierungskredite.
2. Z.ai Gratis-Token-Programm (Entwickler-CLI)
Z.ai bietet Entwicklern, die die Z.ai-Coding-CLI nutzen, ein großzügiges Gratis-Token-Kontingent (Community-Berichte sprechen von ca. 300 Mio. Token). Konditionen und Verfügbarkeit können sich ändern — aktuelle Informationen unter z.ai.
3. Selbst-Hosting (MIT-Lizenz)
Da GLM 5.2 unter der MIT-Lizenz veröffentlicht wurde, können die vollständigen Modellgewichte von Hugging Face (zai-org/GLM-5.2) heruntergeladen und kostenlos selbst betrieben werden. Zu beachten: Das Modell benötigt im BF16-Format über 1 TB GPU-VRAM — praktisch nur für Organisationen mit umfangreicher Infrastruktur.
4. ZCode 3.0 Tagesfreivolumen
Zhipus ZCode 3.0 bietet berechtigten Nutzern täglich 3 Millionen kostenlose GLM 5.2-Token. Details unter open.bigmodel.cn/glm-coding.
GLM 5.2 API-Preise
Die GLM 5.2-Standalone-API ist seit dem 16. Juni 2026 über die Z.ai-Entwicklerplattform verfügbar.
Token-Tarife (Stand Juni 2026)
| Token-Typ | Preis pro 1 Mio. Token |
|---|---|
| Eingabe-Token | $1,40 |
| Gecachte Eingabe-Token | $0,26 |
| Ausgabe-Token | $4,40 |
Der gecachte Eingabepreis ist besonders wertvoll für Agenten-Workflows, die wiederholt denselben großen Codebase-Kontext referenzieren. Bei $0,26/MTok spart Caching über 80 % im Vergleich zu ungecachten Anfragen.
Kostenbeispiele aus der Praxis
Agenten-Workflow: 10.000 Aufrufe/Tag (je 2.000 Eingabe + 500 Ausgabe-Token)
| Modell | Tägliche API-Kosten |
|---|---|
| GLM 5.2 | ca. $23/Tag |
| GPT-5.5 | ca. $95/Tag |
| Claude Opus 4.8 | ca. $375/Tag |
Monatliche Stapelverarbeitung: 10 Mio. Token (50/50 Eingabe/Ausgabe)
| Modell | Monatskosten |
|---|---|
| GLM 5.2 | ca. $29/Monat |
| GPT-5.5 | ca. $175/Monat |
| Claude Opus 4.8 | ca. $150/Monat |
GLM 5.2 Abonnementpläne (GLM Coding Plan)
Neben der Pay-per-Token-API bietet Z.ai den GLM Coding Plan — ein monatliches Flatrate-Abonnement für die Nutzung in unterstützten Coding-Tools (Claude Code, VS Code, Cursor u. a.).
GLM Coding Plan-Tarife
| Plan | Monatlicher Preis (ca.) | Nutzungskontingent | Am besten für |
|---|---|---|---|
| Lite | ca. $10–$18/Monat | ca. 400 Anfragen/Woche | Leichtes Iterieren an kleinen Repositories |
| Pro | ca. $30–$50/Monat | ca. 2.000 Anfragen/Woche (5× Lite) | Tägliche Entwicklung an mittelgroßen Projekten |
| Max | ca. $80–$112/Monat | ca. 8.000 Anfragen/Woche (20× Lite) | Schwere Workloads, dedizierte Ressourcen |
| Team | Sitzplatz-basierte Preisgestaltung | Individuell | Unternehmen mit Team-Abrechnung |
Hinweis: Jahresabonnements bieten typischerweise ca. 10–15 % Rabatt. Aktuelle Preise und regionale Angebote unter z.ai/subscribe.
GLM 5.2 auf OpenRouter
GLM 5.2 ist auf OpenRouter verfügbar, dort leicht günstiger als direkt über Z.ai:
| Token-Typ | OpenRouter-Preis pro 1 Mio. Token |
|---|---|
| Eingabe | $1,00 |
| Gecachte Eingabe | $0,26 |
| Ausgabe | $4,00 |
GLM 5.2 im Preisvergleich: Claude vs. GPT-5.5
Vollständiger Vergleich der wichtigsten Frontier-Modelle (Stand Juni 2026):
| Modell | Eingabe ($/MTok) | Ausgabe ($/MTok) | Kontextfenster |
|---|---|---|---|
| GLM 5.2 | $1,40 | $4,40 | 1 Mio. Token |
| GPT-5.5 | $5,00 | $30,00 | 128K Token |
| Claude Opus 4.8 | $5,00 | $25,00 | 200K Token |
| Gemini 3.1 Pro | ~$3,50 | ~$10,50 | 2 Mio. Token |
Wichtigste Erkenntnisse:
- GLM 5.2-Eingabe ist 3,6× günstiger als Claude Opus 4.8 und GPT-5.5.
- GLM 5.2-Ausgabe ist 5,7× günstiger als Claude Opus 4.8 und 6,8× günstiger als GPT-5.5.
- 1-Million-Token-Kontextfenster zum Bruchteil des Konkurrenzpreises.
So erhält man einen GLM 5.2 API-Schlüssel
Über Z.ai (Weltweit)
- Auf docs.z.ai registrieren.
- Zum GLM Coding Plan navigieren und Tarif auswählen.
- Nach dem Abonnement unter Individual Coding Plan > Plan Overview einen API-Schlüssel generieren.
- Team-Plan-Nutzer: API-Schlüssel unter Team Coding Plan > My Plan abrufen.
- Base-URL auf
https://api.z.ai/api/coding/paas/v4setzen.
Schnellkonfiguration für Claude Code
# Automatischer Helfer
npx @z_ai/coding-helper
# Oder manuell: ~/.claude/settings.json bearbeiten
# ANTHROPIC_BASE_URL auf https://api.z.ai/api/anthropic setzen
# ANTHROPIC_AUTH_TOKEN auf den Z.ai-API-Schlüssel setzen
Lohnt sich GLM 5.2?
Für Coding- und Agenten-Aufgaben: Ja, eindeutig. GLM 5.2 wurde speziell für langfristige Software-Engineering-Aufgaben entwickelt. Bei etwa einem Sechstel der Gesamtkosten von GPT-5.5 und vergleichbaren oder besseren Ergebnissen auf mehreren Coding-Benchmarks ist das Preis-Leistungs-Verhältnis für Entwicklungsteams hervorragend.
Häufig gestellte Fragen
Wie viel kostet GLM 5.2?
Stand Juni 2026: $1,40/MTok Eingabe, $4,40/MTok Ausgabe, $0,26/MTok gecachte Eingabe über die direkte Z.ai-API. Auf OpenRouter: $1,00/MTok Eingabe und $4,00/MTok Ausgabe. Abonnementpläne beginnen bei ca. $10–$18/Monat (Lite-Tarif).
Gibt es einen kostenlosen GLM 5.2-Plan?
Ja. Neue Nutzer auf bigmodel.cn erhalten 20 Millionen kostenlose Token. Die Z.ai-Coding-CLI bietet ebenfalls ein großzügiges Gratis-Token-Kontingent (~300 Mio. Token). Die vollständigen Modellgewichte sind auf Hugging Face unter der MIT-Lizenz kostenlos verfügbar.
Wie viel kostet die GLM 5.2 API pro Token?
Über Z.ai direkt: $0,0000014 pro Eingabe-Token und $0,0000044 pro Ausgabe-Token. Über OpenRouter: $0,000001 pro Eingabe-Token und $0,000004 pro Ausgabe-Token.
Ist GLM 5.2 günstiger als Claude?
Ja, erheblich. Im Vergleich zu Claude Opus 4.8 ($5/MTok Eingabe, $25/MTok Ausgabe) ist GLM 5.2 3,6× günstiger bei der Eingabe und 5,7× günstiger bei der Ausgabe.
Wo bekommt man einen GLM 5.2 API-Schlüssel?
Für globalen Zugang: Registrierung auf z.ai oder Schnellstart unter docs.z.ai. Alternativ über OpenRouter oder Together AI.
Hat GLM 5.2 eine kostenlose API?
Ja — neue Konten auf bigmodel.cn erhalten 20 Mio. Token Gratisguthaben. Z.ai bietet ebenfalls ein Promotions-Freivolumen für die Coding-CLI. Die Modellgewichte sind auf Hugging Face kostenlos zum Download verfügbar.
Verwandte Artikel
- Ist GLM 5.2 kostenlos? Alle kostenlosen Zugangsmöglichkeiten erklärt
- GLM 5.2 Testbericht: Benchmarks, Stärken & Schwächen
- GLM 5.2 Hardwareanforderungen für Self-Hosting
Zuletzt aktualisiert: 22. Juni 2026. Preisinformationen stammen aus der offiziellen Z.ai-Dokumentation, OpenRouter und Drittanbieter-Berichten. Aktuelle Preise immer unter z.ai/subscribe und bigmodel.cn/pricing prüfen.
Verwandte Leitfäden
Gehen Sie im Gemma-4-Cluster mit dem nächsten Leitfaden weiter, der zu Ihrer aktuellen Entscheidung passt.

GLM 5.2 Test: Benchmarks, Coding-Leistung und lohnt sich der Einsatz?
GLM 5.2 wurde am 13. Juni 2026 veröffentlicht – 744B MoE-Parameter, 1-Million-Token-Kontextfenster, MIT-Lizenz und Benchmark-Werte, die mit geschlossenen Frontier-Modellen konkurrieren, zu etwa einem Sechstel der GPT-5.5-API-Kosten.

Ist GLM 5.2 kostenlos? Alle kostenlosen Nutzungsmöglichkeiten 2026
GLM 5.2 ist unter der MIT-Lizenz frei herunterladbar und selbst hostbar. Kostenlose Tests sind außerdem über Cloudflare Workers AI und den z.ai-Webchat möglich. Dieser Leitfaden erklärt alle kostenlosen Optionen und zeigt, wann Kosten anfallen.

GLM-5.2 in Ollama ausführen: Cloud-Tag, lokales Setup & API-Anleitung
GLM-5.2 ist in Ollama über den glm-5.2:cloud-Tag verfügbar — ein einziger Befehl genügt für ein 976K-Kontext-Coding-Modell, ohne 744B Parameter selbst herunterladen zu müssen.
Sie wissen noch nicht, was Sie als Nächstes lesen sollen?
Gehen Sie zurück zum Leitfaden-Hub, um Modellvergleiche, Setup-Anleitungen und Seiten zur Hardware-Planung zu durchsuchen.
