Gemma 4 ガイド

GLM 5.2 レビュー:ベンチマーク、コーディング性能、使う価値はあるか?

約 12 分
glm 5.2zhipu aillm reviewcoding llmai model
GLM 5.2 レビュー:ベンチマーク、コーディング性能、使う価値はあるか?

GLM 5.2 レビュー:Zhipu AIのオープンウェイト旗艦は本当に使えるのか?

GLM 5.2 は、Zhipu AI(現在はZ.aiブランドで運営)による最新のオープンウェイトモデルで、2026年6月13日にリリースされました。クローズドソースのコーディング性能との差を実質的に縮めた最初のオープンモデルです。SWE-bench Pro で62.1点、Design Arenaのコードカテゴリランキングで1位を獲得し、完全に寛容なMITライセンスのもと、GPT-5.5の約6分の1のAPI費用でこれを実現しています。

このレビューでは、GLM 5.2が実際に何であるか、ベンチマークが何を示しているか、どのような用途に適しているか、そしてClaude Opus 4.8やGPT-5.5と比較してどうなのかを解説します。

クイックアンサー

リリース日 2026年6月13日
開発者 Zhipu AI / Z.ai
アーキテクチャ Mixture-of-Experts (MoE)
総パラメータ数 約744〜753億
トークンあたりの有効パラメータ 約400億
コンテキストウィンドウ 1,000,000トークン
最大出力 131,072トークン
ライセンス MIT(完全許可型)
無料で使える? はい — APIフリーティアとオープンウェイト
最も得意なこと 長期自律コーディング、エージェントワークフロー、フロントエンド生成、長文書分析

まとめ: GLM 5.2は2026年6月時点で最も強力なオープンウェイトコーディングモデルです。Claude Opus 4.8と競合し、複数の長期コーディングベンチマークでGPT-5.5を上回り、Z.ai APIの価格は入力$1.40/出力$4.40(百万トークンあたり)— GPT-5.5の総コストの約6分の1です。


GLM 5.2とは何か?

GLM 5.2は、Zhipu AIが開発したGLM (General Language Model) シリーズの最新モデルです。Zhipu AIは2019年に設立された北京のAI企業で、清華大学の知識工学グループから分離独立しました。現在は上場企業としてZ.aiブランドでモデルプラットフォームを運営しています。

GLMシリーズは中国語言語モデルの発展を目指す学術プロジェクトとして始まり、多言語、マルチモーダル、エージェント対応の大規模言語モデルへと発展しました。世代の変遷:GLM → GLM-2 → GLM-3 → GLM-4 → GLM-5.0 → GLM-5.1 → GLM-5.2。

GLM 5.2はこのシリーズ最大の飛躍です。コンテキストウィンドウが~20万から100万トークンに拡張(5倍)、SWE-bench Proが58.4から62.1に向上。段階的な改善ではなく、真の世代間飛躍です。

当初のアクセスは6月13日のZ.aiのGLM Coding Plan有料サブスクライバーを通じて行われ、オープンウェイトは約6月17日にzai-org組織のHugging Faceに公開されました(MITライセンス、地域制限なし)。


GLM 5.2のアーキテクチャと技術的詳細

GLM 5.2はMixture-of-Experts (MoE) アーキテクチャを採用しています。主要な仕様:

  • 総パラメータ数: 約744〜753億
  • トークンあたりの有効パラメータ: 約400億(各推論ステップで一部の専門家のみが起動)
  • コンテキストウィンドウ: 1,000,000トークン(GLM-5.1の約5倍)
  • 最大出力トークン数: 131,072
  • 推論モード: HighとMaxのトグルで遅延と品質のトレードオフを制御

IndexShare — コアアーキテクチャイノベーション

GLM 5.2の最も重要なアーキテクチャの変更はIndexShareです。スパースアテンションにおいて、各レイヤーに独自のインデクサーを実行する代わりに、4つのスパースアテンションレイヤーにわたって単一の軽量インデクサーが共有されます。Zhipu AIは、これにより100万トークンのコンテキスト長でのトークンあたりのFLOPsが約2.9倍削減されると報告しています。

IndexShareなしでは、744B MoEモデルでの100万トークン推論は商用規模では非常にコストがかかりすぎます。IndexShareがこの大きなコンテキストウィンドウを実用的にしています。

マルチトークン予測(MTP)レイヤー

GLM 5.2は投機的デコード(speculative decoding) のための更新されたMTPレイヤーも導入しており、出力分布を変えずに生成速度を向上させます。

ライセンス

GLM 5.2のウェイトはMITライセンスの下で公開されています。地域制限なし、収益条項なし、大規模デプロイメントへの特別条項なし。ライセンス料なしで商用利用、製品への組み込み、ファインチューニング、セルフホスティングが可能です。


GLM 5.2 ベンチマーク

以下の数値はZhipu AIの公式評価レポートと独立したトラッカー(BenchLM.ai、Artificial Analysis)から引用しています。

標準コーディングベンチマーク

ベンチマーク GLM 5.2 Claude Opus 4.8 GPT-5.5
SWE-bench Pro 62.1 ~63 ~58.6
SWE-bench Verified ~81.0
Terminal-Bench 2.1 81.0 ~85.0

GLM 5.2はTerminal-Bench 2.1で81.0を記録し、Claude Opus 4.8(85.0)からわずか数点差で、他のオープンウェイトモデルを大幅に上回っています。SWE-bench Pro(62.1)ではGPT-5.5(~58.6)を上回り、Claude Opus 4.8とほぼ同等です。

長期コーディングベンチマーク

ベンチマーク GLM 5.2 GPT-5.5 Claude Opus 4.8
FrontierSWE 74.4% 72.6% 75.1%
PostTrainBench 2位 GLM 5.2以下 1位(Opus 4.8)

FrontierSWEは現実的な長期コーディングタスクのためのベンチマークです。GLM 5.2は74.4%を達成し、GPT-5.5(72.6%)を上回り、Claude Opus 4.8(75.1%)に約0.7ポイント差まで迫っています。

デザインとフロントエンド

実際のユーザーの好みを基にしたhead-to-head比較に基づくDesign ArenaのCode Categoriesランキングで、GLM 5.2が総合1位を獲得し、Claude Fable 5を10 Eloポイント上回っています。

インテリジェンスインデックス

Intelligence Index v4.1では、GLM 5.2は51点を記録し、MiniMax-M3(44)、DeepSeek V4 Pro(44)、Kimi K2.6(43)を上回り、フロンティアティアに入りました。

BenchLMランキング

BenchLM.aiは2026年6月中旬にGLM 5.2を124モデル中4位に、総合スコア91/100で評価しています。


GLM 5.2は何に最も適しているか?

長期自律コーディングとエージェントワークフロー

これがGLM 5.2の設計の中心です。100万トークンのコンテキストウィンドウは、単一のプロンプトで相当規模のコードベースをロードできることを意味します。FrontierSWEとSWE-benchのスコアは、多くのステップにわたって信頼性の高いコード生成を維持できることを示しています。計画、ファイルをまたいだ編集、テスト実行、反復修正が必要なコーディングエージェントを構築している場合、GLM 5.2は現在最も強力なオープンウェイトの選択肢です。

フロントエンドコード生成

Design ArenaのCode Categoriesランキングでのトップ1という結果は重要なシグナルです。このスコアは実際のコーディングタスクでの本物のユーザー嗜好に基づいています。自然言語プロンプトやモックアップからフロントエンドコードを生成するために、GLM 5.2はこの指標では現在世界最高のモデルです。

長文書分析

100万トークンのコンテキスト+$1.40/MTokの入力価格は、長い契約書、コードベース、研究文書の処理を経済的にします。

セルフホステッド/オンプレミスデプロイメント

地域制限のないMITライセンスは、クラウドルーティングモデルを使用できない組織にとってGLM 5.2を魅力的なものにしています。

GLM 5.2が不向きな用途

  • 純粋な数学競技ベンチマーク: より重い推論事前学習を持つモデルがまだ優位
  • 超低遅延チャット: 思考モードが遅延を増加させる
  • 設定なしで使いたいチーム: 最大のパフォーマンスには慎重なプロンプト設計が必要

GLM 5.2 vs 競合モデル

GLM 5.2 Claude Opus 4.8 GPT-5.5
SWE-bench Pro 62.1 ~63 ~58.6
FrontierSWE 74.4% 75.1% 72.6%
Terminal-Bench 2.1 81.0 85.0
Design Arena 1位 あり なし なし
コンテキストウィンドウ 100万トークン 様々 様々
API入力価格 $1.40/MTok $5.00/MTok $5.00/MTok
API出力価格 $4.40/MTok $25.00/MTok $30.00/MTok
オープンウェイト あり(MIT) なし なし
セルフホスティング可能 可能 不可 不可

GLM 5.2 vs Claude Opus 4.8

Claude Opus 4.8はTerminal-Bench 2.1(85.0 vs 81.0)とFrontierSWE(75.1% vs 74.4%)でわずかに優位であり、全体的な推論能力も若干高いです。しかしGLM 5.2はDesign Arenaのフロントエンドランキングでリードし、SWE-bench Proではほぼ同等で、コストは入力で約3.6倍、出力で約5.7倍安くなっています

GLM 5.2 vs GPT-5.5

GPT-5.5はSWE-bench Pro(58.6 vs 62.1)とFrontierSWE(72.6% vs 74.4%)でGLM 5.2より劣り、入力で約3.6倍、出力で約6.8倍高コストです


価格概要

Z.ai経由のGLM 5.2 API価格(2026年6月16日時点):

ティア 価格
入力トークン $1.40 / 百万トークン
出力トークン $4.40 / 百万トークン
GLM Coding Plan Lite $12.60/月
GLM Coding Plan Pro $50.40/月
GLM Coding Plan Max $112.00/月

詳細な価格についてはGLM 5.2価格ガイドをご覧ください。


ハードウェア要件

GLM 5.2は大規模なモデルです。ローカル実行には相当なハードウェアが必要です:

  • 2ビット量子化(Unsloth Dynamic 2-bit GGUF): ~239GBストレージ、~245GB+ RAM
  • 4ビット量子化: ~376GB RAM(推定)
  • フルBF16ウェイト: ~1.51TBディスク容量
  • 実用的な消費者向け構成: 4× RTX 3090 + 192GBシステムRAM、または256GB+ Mac Studio

2ビット量子化での消費者向けハードウェアでは、1秒あたり約3〜9トークンの生成速度が期待できます。ほとんどのチームにとってはクラウドAPIの方が実用的です。

完全なハードウェアガイド:GLM 5.2ハードウェア要件


よくある質問(FAQ)

GLM 5.2とは何ですか?

GLM 5.2はZhipu AI(Z.ai)が2026年6月13日にリリースしたオープンウェイトフラッグシップモデルです。約744Bパラメータのモデルで、100万トークンのコンテキストウィンドウ、トークンあたり約40Bの有効パラメータ、MITライセンスを持ちます。現在、長期コーディングタスクとフロントエンド生成において最も強力なオープンウェイトモデルです。

GLM 5.2は無料ですか?

GLM 5.2はZ.aiの開発者コンソールを通じて無料のAPIティアを提供しています。オープンウェイトはMITライセンスの下でHugging Faceから無料でダウンロードできます。有料プラン(GLM Coding Plan Lite/Pro/Max)はより高いレート制限を提供します。詳細:GLM 5.2無料ティアガイド

GLM 5.2はオープンソースですか?

はい。GLM 5.2のウェイトはHugging Faceのzai-org組織の下で完全に許可型のMITライセンスで公開されています。地域制限なし、収益条項なし、承認プロセスなし。

GLM 5.2はClaudeと比べてどうですか?

GLM 5.2はほとんどのコーディングベンチマークでClaude Opus 4.8に近い性能を持ちます:FrontierSWE 74.4% vs 75.1%、SWE-bench Pro 62.1 vs ~63、Terminal-Bench 2.1 81.0 vs 85.0。GLM 5.2はDesign Arenaのフロントエンドランキングでリードしています。主な違いはコストで、GLM 5.2は入力で約3.6倍、出力で約5.7倍安いです。

GLM 5.2はローカルで実行できますか?

可能ですが、相当なハードウェアが必要です。2ビット量子化バージョンは約245GB RAMが必要です。ほとんどの開発者にはクラウドAPIの方が実用的です。詳細:GLM 5.2ハードウェア要件ガイド

GLM 5.2は何に最も適していますか?

最適な用途:長期自律コーディング(計画→ファイルをまたいだ編集→テスト→反復)、フロントエンドコード生成、100万トークンコンテキストを使った長文書分析、中英バイリンガルワークフロー、MITライセンスのセルフホスティングが必要なデプロイメント。


関連ガイド

関連記事

Gemma 4 の記事群をそのまま辿り、今の判断にいちばん近い次の記事へ進んでください。

次に何を読めばいいか迷っていますか?

ガイド一覧に戻って、モデル比較、ローカル導入、ハードウェア計画の3方向から続けて見ていけます。