Gemma 4 ガイド
GLM 5.2は無料?2026年の全ての無料利用方法まとめ

短い回答:GLM 5.2は無料ですか?
はい — GLM 5.2は複数の方法で無料利用できます。
- モデルの重みはMITライセンスで公開されており、Hugging Faceから無料でダウンロード可能です。
- Cloudflare Workers AIはLLM Playgroundでのプレビューを登録なし・支払いなしで提供しています。
- Z.aiウェブチャットは日常会話や軽いコーディング作業向けの無料プランがあります。
- Ollamaは
glm-5.2:cloudタグで推論をOllama Cloud GPUにルーティングします。 - 重みをダウンロードしてllama.cppやvLLMでのセルフホストは永久無料です。
有料になるもの: z.aiの本番APIエンドポイントへの直接呼び出し — 入力100万トークンあたり$1.40、出力100万トークンあたり$4.40(2026年6月時点)。GLM Coding Planのサブスクリプションはライトプランで月約$3〜6から。
GLM 5.2の無料利用方法
1. Z.aiウェブチャット(無料プラン)
z.aiにアクセスするだけで会話を始められます。無料プランはクレジットカード不要で、日常的な会話、質問応答、軽いコーディングタスクに利用できます。リクエスト制限があります — 現在のクォータはz.ai公式で確認してください(変更される場合があります)。
2. Cloudflare Workers AI Playground(登録不要)
CloudflareのWorkers AI LLM Playgroundはアカウントや認証なしでGLM 5.2をホストしています。ページを開いてプロンプトを入力すれば即座に回答が得られます。最もセットアップが不要な方法です。
3. Ollama(glm-5.2:cloudタグ)
Ollamaをインストール済みなら、glm-5.2:cloudタグがローカルマシンではなくOllama Cloud GPUに推論をルーティングします:
ollama run glm-5.2:cloud
大量のローカルVRAMは不要です。最新のタグと利用制限はollama.com/library/glm-5.2で確認してください。
4. Hugging Face Inference Providers(期間限定の無料枠)
2026年6月のリリース直後、Hugging FaceはInference Providersを通じて無料推論の枠を開放しました。現在の状況はzai-org/GLM-5.2のモデルページで確認してください。
5. Puter.js(無料、バックエンド不要)
Puter.jsはAPIキーやバックエンド登録なしに、ブラウザ側からZ.ai GLMモデルを無料で利用できます。一部レート制限がありますが、セットアップゼロで始められます。
6. MITライセンスの重みをセルフホスト
Hugging Face(zai-org/GLM-5.2)から重みをダウンロードして、llama.cpp、vLLM、またはLM Studioでローカル実行します。ダウンロード後はトークンコストが永久に発生しません。ハードウェア要件は高く、完全精度モデルは約1.51 TBです。unsloth/GLM-5.2-GGUFの量子化バージョンで大幅に削減できます(最小の2ビット量子化で約241 GB VRAMが必要)。
GLM 5.2はオープンソースですか?
はい。GLM 5.2はオープンウェイトモデルで、MITライセンスで公開されています。
MITライセンスは最も許容度の高いオープンソースライセンスの一つで、以下の権利を付与します:
- モデルの重みを無料でダウンロード、使用、修正
- 独自目的のためのファインチューニング
- ロイヤリティなしでの商用展開
- 再配布またはサブライセンス
地域制限なし — 重みは地理的ロックなしで世界中で利用可能です。
モデルの重みのホスト先:
- Hugging Face:
zai-org/GLM-5.2 - ModelScope(中国のユーザー向け)
「オープンウェイト」と「完全オープンソース」の違い: 重みとライセンスは完全にオープンです。一部の議論では「オープンウェイト」(重みを公開)と「完全オープンソース」(学習データやコードも公開)を区別します。GLM 5.2の推論コードとモデルの重みは自由に利用できますが、完全な学習インフラの詳細は完全には公開されていない可能性があります。
GLM 5.2無料プランの制限
| アクセス方法 | コスト | 制限 |
|---|---|---|
| Z.aiウェブチャット | 無料 | レート制限あり;z.aiで現在のクォータを確認 |
| Cloudflare Workers AI Playground | 無料 | テスト専用;本番環境不可 |
| Ollama glm-5.2:cloud | 無料(Ollama Cloud) | Ollama Cloudの利用ポリシーに準拠 |
| Hugging Face Inference Providers | 無料(期間限定) | 期限切れやスロットリングの可能性あり |
| Puter.js | 無料 | アプリ別レート制限 |
| セルフホスト | 永久無料 | 自前のハードウェアに制限される |
大規模な本番利用には、無料プランでは通常不十分です。
GLM 5.2の無料API
無料のGLM 5.2 APIはありますか?
Z.aiからの永久に無制限の無料APIはありません。ただし、ほぼ無料に近いオプションがいくつかあります:
- 新規ユーザークレジット:z.aiは新規アカウントのサインアップ時に無料クレジットを付与します。正確な金額は変動するため、サインアップ時にdocs.z.aiで確認してください。
- Z.ai Coding CLIの無料枠:Z.aiは開発者を引きつけるために、Coding CLIに大量の無料トークン枠を用意しています(コミュニティ報告では約3億トークン)。資格と枠は変更される場合があります。
- Cloudflare Workers AI:テスト用は無料ですが、本番APIコールには適していません。
- Puter.js:ブラウザアプリ向けのキー不要のAPIライクなインターフェースを提供。
有料APIの価格(2026年6月時点)
- 入力トークン:100万トークンあたり$1.40
- 出力トークン:100万トークンあたり$4.40
- キャッシュ入力:プロンプトキャッシングで大幅削減(正確なキャッシュレートはdocs.z.aiで確認)
GLM 5.2はGPT-5.5などのフロンティアモデルと比べて約1/6のコストです。最新の公式価格は必ずdocs.z.ai/guides/overview/pricingで確認してください。
Z.ai APIキーの取得方法
- z.aiでアカウントを作成
- APIキー管理セクションに移動
- 新しいキーを生成
- OpenAI互換エンドポイントで使用(APIはOpenAIのchat completions形式と互換性あり)
いつ有料プランが必要になりますか?
以下の場合に有料プランを検討してください:
- 無料トライアルクレジットを超える本番APIアクセスが必要な場合
- 無料プランのレート制限を超える高いリクエスト量が必要な場合
- コーディングIDEでGLM 5.2を使用する場合(Cursor、Cline、Claude Code)— GLM Coding Plansはこのために設計されています
- SLA保証や優先スループットが必要な場合
- セルフホスト用のハードウェアがなく、安定した稼働時間が必要な場合
モデルを単に評価するだけなら、上記の無料オプション(特にCloudflareとz.aiの無料プラン)で十分です。
GLM 5.2を無料で使う:ステップバイステップガイド
最も速い方法はアカウントもダウンロードも不要です。
方法A:Cloudflare Workers AI(ゼロセットアップ、テスト推奨)
- ブラウザを開いてdevelopers.cloudflare.com/workers-ai/models/glm-5.2/にアクセス
- ページの「LLM Playground」セクションを見つける
- 入力フィールドにプロンプトを入力
- 「Run」をクリックするかEnterを押す
- 回答を読む — ログイン不要、クレジットカード不要
方法B:Z.aiウェブチャット(無料プラン、継続利用に最適)
- z.aiにアクセス
- 無料アカウントを作成(メール登録、クレジットカード不要)
- モデルセレクターでGLM 5.2を選択
- チャット開始
方法C:Ollamaクラウドタグ(開発者向け)
- Ollamaをインストール:
curl -fsSL https://ollama.com/install.sh | sh - クラウドホスト型モデルを取得:
ollama run glm-5.2:cloud - プロンプトを入力してEnterを押す
- アプリでローカルAPIエンドポイント
http://localhost:11434を使用
方法D:llama.cppでのセルフホスト(最大限の制御)
- llama.cppをインストール:github.com/ggml-org/llama.cppの手順に従う
- huggingface.co/unsloth/GLM-5.2-GGUFから量子化GGUFをダウンロード(VRAMに合ったサイズを選択)
- 実行:
llama-server -m GLM-5.2-Q2_K.gguf --host 0.0.0.0 --port 8080 - ローカルAPI
http://localhost:8080を呼び出す — 永久無料
よくある質問
GLM 5.2は無料ですか?
部分的に無料です。GLM 5.2の重みはMITライセンスで無料でダウンロードおよびセルフホストでき、Cloudflare Workers AI Playgroundで無料テストが可能(登録不要)、z.aiウェブチャットには無料プランがあります。z.aiの本番APIへの直接呼び出しは有料です(2026年6月時点:入力$1.40/百万トークン、出力$4.40/百万トークン)。
GLM 5.2はオープンソースですか?
はい。GLM 5.2はMITライセンスで公開されています — 最も許容度の高いオープンソースライセンスの一つです。ロイヤリティなし、地域制限なしでモデルの重みを無料でダウンロード、修正、ファインチューニング、商用展開できます。重みはHugging Faceのzai-org/GLM-5.2でホストされています。
サインアップなしでGLM 5.2を使えますか?
はい。Cloudflare Workers AI LLM Playgroundでは、アカウントなしにブラウザから直接GLM 5.2を実行できます。Puter.jsもキーなしのブラウザベースアクセスを提供します。継続的な利用には、無料のz.aiアカウントがより多くの機能を提供します。
無料のGLM 5.2 APIはありますか?
永久に無制限のものはありません。Z.aiはサインアップ時に新規ユーザーに無料クレジットを付与します。レート制限なしの完全無料APIには、MITライセンスの重みのセルフホストが唯一の永続的な解決策です。
GLM 5.2を無料で使うには?
最も簡単な方法:developers.cloudflare.com/workers-ai/models/glm-5.2/にアクセスしてLLM Playgroundを使う — 登録不要。継続的な無料利用にはz.aiで無料アカウントを作成。トークンコストなしの開発者利用には、Hugging Faceから重みをダウンロードしてllama.cppまたはOllamaでローカル実行。
GLM 5.2の無料プランの制限は何ですか?
z.aiウェブチャットの無料プランにはレート制限があります(具体的な数値は変動する可能性があるため、z.aiで確認してください)。Cloudflare Playgroundはテスト専用で、本番APIではありません。新規ユーザーAPIクレジットは有限です。セルフホストは技術的に無制限ですが、相当のハードウェアが必要です(最小量子化バージョンで約241 GB VRAMが必要)。
関連ガイド
関連記事
Gemma 4 の記事群をそのまま辿り、今の判断にいちばん近い次の記事へ進んでください。

GLM 5.2 料金完全ガイド:API価格・サブスクリプション・無料枠(2026年)
2026年版GLM 5.2料金完全ガイド:APIトークン料金、GLM Coding Planサブスクリプション(Lite/Pro/Max/Team)、OpenRouter価格、無料アクセス方法をまとめています。

GLM 5.2 レビュー:ベンチマーク、コーディング性能、使う価値はあるか?
GLM 5.2は2026年6月13日にリリース。744BのMoEパラメータ、100万トークンのコンテキストウィンドウ、MITライセンスを持ち、GPT-5.5の約6分の1のAPI費用でクローズドソースのフロンティアモデルに匹敵するベンチマーク成績を達成したオープンウェイトモデルです。

OllamaでGLM-5.2を実行する方法:Cloudタグ、ローカル設定、APIガイド
GLM-5.2はglm-5.2:cloudタグでOllamaから利用可能です。コマンド一つで976Kコンテキストのコーディングモデルが使え、744Bパラメータを自分でダウンロードする必要はありません。
次に何を読めばいいか迷っていますか?
ガイド一覧に戻って、モデル比較、ローカル導入、ハードウェア計画の3方向から続けて見ていけます。
