Gemma 4 ガイド

DiffusionGemmaはLM Studioで動作するか?現在の状況(2026年6月)

約 7 分
diffusiongemmalm studioggufローカルllmgemma 4
DiffusionGemmaはLM Studioで動作するか?現在の状況(2026年6月)

いいえ、DiffusionGemmaは現在LM Studioで動作しません。 設定の問題でも、ファイルの問題でもありません。LM Studioにバンドルされているランタイム(llama.cppエンジンとApple Silicon用MLXエンジンの両方)はdiffusion-gemmaアーキテクチャをサポートしていません。GitHubで2つの確認済みバグレポートが追跡されています。

試したときに実際に何が起きるか

Apple Silicon(MLXパス)

LM StudioのMLXエンジン(バージョン1.8.5)でDiffusionGemmaをロードしようとすると:

Failed to load model.
Error when loading model: ValueError: Model type diffusion_gemma not supported.
Error: No module named 'mlx_vlm.speculative.drafters.diffusion_gemma'

LM Studioがmlx-vlm 0.4.5(2026年4月の開発ビルド)をバンドルしているためです。DiffusionGemmaにはmlx-vlm 0.6.3以降が必要です。アプリ内でLM Studioエンジンを更新しても解決しません。バンドルされているライブラリバージョンはLM Studioがアップデートを発行するまでそのままです。

追跡中:lmstudio-bug-tracker #2037

Windows / Linux(llama.cppパス)

LM StudioのllaMa.cppエンジン(Metal llama.cpp v2.21.0など)は以下のエラーで失敗します:

error loading model: unknown model architecture: 'diffusion-gemma'

llama.cppのDiffusionGemmaサポートがPR #24423にあり、まだマージされていないためです。LM Studioはリリース版のllama.cppをバンドルしているため、このPRは含まれていません。

追跡中:lmstudio-ai/lms #583

LM StudioはいつDiffusionGemmaをサポートするか

LM Studioのサポートは2つのことがアップストリームでマージされるかどうかにかかっています:

  1. PR #24423がllama.cpp mainにマージされる(llama.cppパス)
  2. mlx-vlm 0.6.3+がバンドルされる(Apple MLXパス)

どちらもまだ起きていません。LM Studioはその後も新しいリリースを出す必要があります。現実的にはこれは数日ではなく数週間かかります。

今実際に動作するもの

ランタイム DiffusionGemmaサポート 備考
Unsloth Studio あり 最も簡単なローカルパス。macOS/Windows/Linux対応。2026年6月12日(v0.1.463-beta)以降サポート。
vLLM あり サービング向け最善。2026年6月10日以降ネイティブサポート。Linux + NVIDIA GPU必要。
HF Transformers あり Pythonのみ。公式Googleウェイトgoogle/diffusiongemma-26B-A4B-it
llama.cpp (PR #24423) あり CLIのみ。PRブランチからビルド必要。llama-diffusion-cli使用。
LM Studio なし MLXとllama.cpp両エンジンが失敗。
Ollama なし Issue #16664オープン中。

ユーザータイプ別推奨パス

デスクトップGUIが欲しい: Unsloth Studioが現在唯一動作するローカルGUIです。インストール後にモデルブラウザでDiffusionGemmaを検索してください。

Apple Siliconユーザー: Unsloth StudioはmacOSをサポートしています。LM StudioのMLXパスはまだ動作しません。

コマンドラインに慣れている: PR #24423からllama.cppをビルドしてllama-diffusion-cliを直接使用してください。拡散ステップ数などのパラメータを最も詳細に制御できます。

Python開発者で素早く実験したい: 公式google/diffusiongemma-26B-A4B-itウェイトでHugging Face Transformersを使用してください。

複数ユーザーにDiffusionGemmaを提供する必要がある: vLLMはネイティブサポートとベンチマーク結果を公開しています。

Ollamaユーザー: 待ってください。カスタムバイナリのビルドなしの回避策はありません。

DiffusionGemmaを使う前に知っておくべきこと

DiffusionGemmaは適切な環境では本物の速度優位性があります。NVIDIA RTX 3090/4090以上の高級カードでは、低い並行性で標準の自己回帰Gemma 4より数倍速く生成できます。低スペックのNVIDIA GPU(3060、4060)やApple Siliconでは速度優位性がまったく現れない可能性があります。このモデルは推論をメモリ帯域幅制限(Apple Siliconの得意分野)から演算制限(高性能専用NVIDIA GPUの得意分野)へと切り替えます。

さらに重要なこと:GoogleはDiffusionGemmaの出力品質が標準Gemma 4を下回ると明示しています。 これは一時的な制限ではありません。速度-品質のトレードオフは拡散アプローチの根本的な特性です。最高品質が必要な場合は、標準Gemma 4が正しい選択です。

DiffusionGemmaに最も適した用途:

  • コードインフィリング(既存コードの中間を埋める)
  • 前後のコンテキストを提供するインライン編集
  • レイテンシが重要で品質の低下が許容できる対話型ローカルアプリケーション

あまり適していない用途:

  • 最高の事実正確性を必要とするタスク
  • 精度が積み重なる複雑な多段階推論
  • 出力を標準Gemma 4と真剣に比較する使用場面

よくある質問

LM Studioを更新すればこれは解決しますか?
mlx-vlm 0.6.3+をバンドルした(Appleの場合)か、PR #24423を含む新しいllama.cppバージョンをバンドルした(その他の場合)LM Studioリリースが出るまでは解決しません。現在のリリースはどちらも対応していません。

LM Studioをカスタムランタイムに向けることはできますか?
LM Studioは現在カスタムllama.cppバイナリの交換をサポートしていません。バンドルされたランタイムが使用されます。

標準Gemma 4はLM Studioで引き続き動作しますか?
はい。gemma4アーキテクチャは現在のLM Studioリリースでサポートされています。制限はdiffusion-gemmaに特有のものです。

解決にどのくらいかかりますか?
予測が難しいです。llama.cppへのPR #24423のマージ、LM Studioの新しいllama.cppバージョンを含むアップデート、MLXチームがmlx-vlmを更新してLM Studioがバンドルすることに依存します。数週間が現実的な見積もりです。

関連ガイド:

関連記事

Gemma 4 の記事群をそのまま辿り、今の判断にいちばん近い次の記事へ進んでください。

次に何を読めばいいか迷っていますか?

ガイド一覧に戻って、モデル比較、ローカル導入、ハードウェア計画の3方向から続けて見ていけます。