Gemma 4 ガイド
DiffusionGemmaはLM Studioで動作するか?現在の状況(2026年6月)

いいえ、DiffusionGemmaは現在LM Studioで動作しません。 設定の問題でも、ファイルの問題でもありません。LM Studioにバンドルされているランタイム(llama.cppエンジンとApple Silicon用MLXエンジンの両方)はdiffusion-gemmaアーキテクチャをサポートしていません。GitHubで2つの確認済みバグレポートが追跡されています。
試したときに実際に何が起きるか
Apple Silicon(MLXパス)
LM StudioのMLXエンジン(バージョン1.8.5)でDiffusionGemmaをロードしようとすると:
Failed to load model.
Error when loading model: ValueError: Model type diffusion_gemma not supported.
Error: No module named 'mlx_vlm.speculative.drafters.diffusion_gemma'
LM Studioがmlx-vlm 0.4.5(2026年4月の開発ビルド)をバンドルしているためです。DiffusionGemmaにはmlx-vlm 0.6.3以降が必要です。アプリ内でLM Studioエンジンを更新しても解決しません。バンドルされているライブラリバージョンはLM Studioがアップデートを発行するまでそのままです。
追跡中:lmstudio-bug-tracker #2037
Windows / Linux(llama.cppパス)
LM StudioのllaMa.cppエンジン(Metal llama.cpp v2.21.0など)は以下のエラーで失敗します:
error loading model: unknown model architecture: 'diffusion-gemma'
llama.cppのDiffusionGemmaサポートがPR #24423にあり、まだマージされていないためです。LM Studioはリリース版のllama.cppをバンドルしているため、このPRは含まれていません。
LM StudioはいつDiffusionGemmaをサポートするか
LM Studioのサポートは2つのことがアップストリームでマージされるかどうかにかかっています:
- PR #24423がllama.cpp mainにマージされる(llama.cppパス)
- mlx-vlm 0.6.3+がバンドルされる(Apple MLXパス)
どちらもまだ起きていません。LM Studioはその後も新しいリリースを出す必要があります。現実的にはこれは数日ではなく数週間かかります。
今実際に動作するもの
| ランタイム | DiffusionGemmaサポート | 備考 |
|---|---|---|
| Unsloth Studio | あり | 最も簡単なローカルパス。macOS/Windows/Linux対応。2026年6月12日(v0.1.463-beta)以降サポート。 |
| vLLM | あり | サービング向け最善。2026年6月10日以降ネイティブサポート。Linux + NVIDIA GPU必要。 |
| HF Transformers | あり | Pythonのみ。公式Googleウェイトgoogle/diffusiongemma-26B-A4B-it。 |
| llama.cpp (PR #24423) | あり | CLIのみ。PRブランチからビルド必要。llama-diffusion-cli使用。 |
| LM Studio | なし | MLXとllama.cpp両エンジンが失敗。 |
| Ollama | なし | Issue #16664オープン中。 |
ユーザータイプ別推奨パス
デスクトップGUIが欲しい: Unsloth Studioが現在唯一動作するローカルGUIです。インストール後にモデルブラウザでDiffusionGemmaを検索してください。
Apple Siliconユーザー: Unsloth StudioはmacOSをサポートしています。LM StudioのMLXパスはまだ動作しません。
コマンドラインに慣れている: PR #24423からllama.cppをビルドしてllama-diffusion-cliを直接使用してください。拡散ステップ数などのパラメータを最も詳細に制御できます。
Python開発者で素早く実験したい: 公式google/diffusiongemma-26B-A4B-itウェイトでHugging Face Transformersを使用してください。
複数ユーザーにDiffusionGemmaを提供する必要がある: vLLMはネイティブサポートとベンチマーク結果を公開しています。
Ollamaユーザー: 待ってください。カスタムバイナリのビルドなしの回避策はありません。
DiffusionGemmaを使う前に知っておくべきこと
DiffusionGemmaは適切な環境では本物の速度優位性があります。NVIDIA RTX 3090/4090以上の高級カードでは、低い並行性で標準の自己回帰Gemma 4より数倍速く生成できます。低スペックのNVIDIA GPU(3060、4060)やApple Siliconでは速度優位性がまったく現れない可能性があります。このモデルは推論をメモリ帯域幅制限(Apple Siliconの得意分野)から演算制限(高性能専用NVIDIA GPUの得意分野)へと切り替えます。
さらに重要なこと:GoogleはDiffusionGemmaの出力品質が標準Gemma 4を下回ると明示しています。 これは一時的な制限ではありません。速度-品質のトレードオフは拡散アプローチの根本的な特性です。最高品質が必要な場合は、標準Gemma 4が正しい選択です。
DiffusionGemmaに最も適した用途:
- コードインフィリング(既存コードの中間を埋める)
- 前後のコンテキストを提供するインライン編集
- レイテンシが重要で品質の低下が許容できる対話型ローカルアプリケーション
あまり適していない用途:
- 最高の事実正確性を必要とするタスク
- 精度が積み重なる複雑な多段階推論
- 出力を標準Gemma 4と真剣に比較する使用場面
よくある質問
LM Studioを更新すればこれは解決しますか?
mlx-vlm 0.6.3+をバンドルした(Appleの場合)か、PR #24423を含む新しいllama.cppバージョンをバンドルした(その他の場合)LM Studioリリースが出るまでは解決しません。現在のリリースはどちらも対応していません。
LM Studioをカスタムランタイムに向けることはできますか?
LM Studioは現在カスタムllama.cppバイナリの交換をサポートしていません。バンドルされたランタイムが使用されます。
標準Gemma 4はLM Studioで引き続き動作しますか?
はい。gemma4アーキテクチャは現在のLM Studioリリースでサポートされています。制限はdiffusion-gemmaに特有のものです。
解決にどのくらいかかりますか?
予測が難しいです。llama.cppへのPR #24423のマージ、LM Studioの新しいllama.cppバージョンを含むアップデート、MLXチームがmlx-vlmを更新してLM Studioがバンドルすることに依存します。数週間が現実的な見積もりです。
関連ガイド:
関連記事
Gemma 4 の記事群をそのまま辿り、今の判断にいちばん近い次の記事へ進んでください。

DiffusionGemmaはllama.cppで動作するか?実際の状況
標準のllama.cppはDiffusionGemmaを実行できません。サポートはPR #24423にあり、専用のllama-diffusion-cliバイナリが提供されます。現在実際に動作するものを説明します。

llama.cppで「unknown model architecture」を修正する:gemma4とdiffusion-gemma
gemma4とdiffusion-gemmaのアーキテクチャエラーは原因が異なり、修正方法も異なります。同じ方法で対処しようとすると時間を無駄にします。

llama.cpp は Gemma 4 に対応している? GGUF の状況、修正、動作確認済みモデル
llama.cpp が Gemma 4 をサポートしているかという疑問に対し、公式 GGUF リンク、現在のサポート状況、そして「サポート済み」が具体的に何を意味するのかを詳しく回答します。
次に何を読めばいいか迷っていますか?
ガイド一覧に戻って、モデル比較、ローカル導入、ハードウェア計画の3方向から続けて見ていけます。
