DiffusionGemmaはLM Studioで動作するか？現在の状況（2026年6月）

いいえ、DiffusionGemmaは現在LM Studioで動作しません。 設定の問題でも、ファイルの問題でもありません。LM Studioにバンドルされているランタイム（llama.cppエンジンとApple Silicon用MLXエンジンの両方）はdiffusion-gemmaアーキテクチャをサポートしていません。GitHubで2つの確認済みバグレポートが追跡されています。

試したときに実際に何が起きるか

Apple Silicon（MLXパス）

LM StudioのMLXエンジン（バージョン1.8.5）でDiffusionGemmaをロードしようとすると：

Failed to load model.
Error when loading model: ValueError: Model type diffusion_gemma not supported.
Error: No module named 'mlx_vlm.speculative.drafters.diffusion_gemma'

LM Studioがmlx-vlm 0.4.5（2026年4月の開発ビルド）をバンドルしているためです。DiffusionGemmaにはmlx-vlm 0.6.3以降が必要です。アプリ内でLM Studioエンジンを更新しても解決しません。バンドルされているライブラリバージョンはLM Studioがアップデートを発行するまでそのままです。

追跡中：lmstudio-bug-tracker #2037

Windows / Linux（llama.cppパス）

LM StudioのllaMa.cppエンジン（Metal llama.cpp v2.21.0など）は以下のエラーで失敗します：

error loading model: unknown model architecture: 'diffusion-gemma'

llama.cppのDiffusionGemmaサポートがPR #24423にあり、まだマージされていないためです。LM Studioはリリース版のllama.cppをバンドルしているため、このPRは含まれていません。

追跡中：lmstudio-ai/lms #583

LM StudioはいつDiffusionGemmaをサポートするか

LM Studioのサポートは2つのことがアップストリームでマージされるかどうかにかかっています：

PR #24423がllama.cpp mainにマージされる（llama.cppパス）
mlx-vlm 0.6.3+がバンドルされる（Apple MLXパス）

どちらもまだ起きていません。LM Studioはその後も新しいリリースを出す必要があります。現実的にはこれは数日ではなく数週間かかります。

今実際に動作するもの

ランタイム	DiffusionGemmaサポート	備考
Unsloth Studio	あり	最も簡単なローカルパス。macOS/Windows/Linux対応。2026年6月12日(v0.1.463-beta)以降サポート。
vLLM	あり	サービング向け最善。2026年6月10日以降ネイティブサポート。Linux + NVIDIA GPU必要。
HF Transformers	あり	Pythonのみ。公式Googleウェイト`google/diffusiongemma-26B-A4B-it`。
llama.cpp (PR #24423)	あり	CLIのみ。PRブランチからビルド必要。`llama-diffusion-cli`使用。
LM Studio	なし	MLXとllama.cpp両エンジンが失敗。
Ollama	なし	Issue #16664オープン中。

ユーザータイプ別推奨パス

デスクトップGUIが欲しい： Unsloth Studioが現在唯一動作するローカルGUIです。インストール後にモデルブラウザでDiffusionGemmaを検索してください。

Apple Siliconユーザー： Unsloth StudioはmacOSをサポートしています。LM StudioのMLXパスはまだ動作しません。

コマンドラインに慣れている： PR #24423からllama.cppをビルドしてllama-diffusion-cliを直接使用してください。拡散ステップ数などのパラメータを最も詳細に制御できます。

Python開発者で素早く実験したい： 公式google/diffusiongemma-26B-A4B-itウェイトでHugging Face Transformersを使用してください。

複数ユーザーにDiffusionGemmaを提供する必要がある： vLLMはネイティブサポートとベンチマーク結果を公開しています。

Ollamaユーザー： 待ってください。カスタムバイナリのビルドなしの回避策はありません。

DiffusionGemmaを使う前に知っておくべきこと

DiffusionGemmaは適切な環境では本物の速度優位性があります。NVIDIA RTX 3090/4090以上の高級カードでは、低い並行性で標準の自己回帰Gemma 4より数倍速く生成できます。低スペックのNVIDIA GPU（3060、4060）やApple Siliconでは速度優位性がまったく現れない可能性があります。このモデルは推論をメモリ帯域幅制限（Apple Siliconの得意分野）から演算制限（高性能専用NVIDIA GPUの得意分野）へと切り替えます。

さらに重要なこと：GoogleはDiffusionGemmaの出力品質が標準Gemma 4を下回ると明示しています。 これは一時的な制限ではありません。速度-品質のトレードオフは拡散アプローチの根本的な特性です。最高品質が必要な場合は、標準Gemma 4が正しい選択です。

DiffusionGemmaに最も適した用途：

コードインフィリング（既存コードの中間を埋める）
前後のコンテキストを提供するインライン編集
レイテンシが重要で品質の低下が許容できる対話型ローカルアプリケーション

あまり適していない用途：

最高の事実正確性を必要とするタスク
精度が積み重なる複雑な多段階推論
出力を標準Gemma 4と真剣に比較する使用場面

よくある質問

LM Studioを更新すればこれは解決しますか？
mlx-vlm 0.6.3+をバンドルした（Appleの場合）か、PR #24423を含む新しいllama.cppバージョンをバンドルした（その他の場合）LM Studioリリースが出るまでは解決しません。現在のリリースはどちらも対応していません。

LM Studioをカスタムランタイムに向けることはできますか？
LM Studioは現在カスタムllama.cppバイナリの交換をサポートしていません。バンドルされたランタイムが使用されます。

標準Gemma 4はLM Studioで引き続き動作しますか？
はい。gemma4アーキテクチャは現在のLM Studioリリースでサポートされています。制限はdiffusion-gemmaに特有のものです。

解決にどのくらいかかりますか？
予測が難しいです。llama.cppへのPR #24423のマージ、LM Studioの新しいllama.cppバージョンを含むアップデート、MLXチームがmlx-vlmを更新してLM Studioがバンドルすることに依存します。数週間が現実的な見積もりです。