Gemma 4 ガイド
llama.cppで「unknown model architecture」を修正する:gemma4とdiffusion-gemma

以下のいずれかのエラーが出た場合:
error loading model: unknown model architecture: 'gemma4'
error loading model: unknown model architecture: 'diffusion-gemma'
見た目は似ていますが、原因はまったく異なります。同じ修正方法を両方に適用しないでください。
どちらのエラーですか?
| エラー文字列 | 意味 | 修正方法 |
|---|---|---|
unknown model architecture: 'gemma4' |
ランタイムがGemma 4リリース前のバージョン | llama.cpp、Ollama、またはアプリを更新する |
unknown model architecture: 'diffusion-gemma' |
DiffusionGemmaはリリース済みのllama.cppに含まれていない | PR #24423からビルドするか別のランタイムを使用する |
重要な違い:gemma4のサポートはllama.cppのmainブランチと現在のOllama/LM Studioリリースに存在します。更新すれば解決します。diffusion-gemmaのサポートは公式リリースにはなく、マージされていないプルリクエスト(#24423)にのみ存在します。最新の公式バージョンに更新してもこれは解決しません。
unknown model architecture: 'gemma4' の修正
このエラーはランタイムがGemma 4の2026年4月リリース前のものであることを意味します。修正方法は更新です。
llama.cpp
cd llama.cpp
git pull
cmake -B build
cmake --build build --config Release -j
# 新しいバイナリを確認
./build/bin/llama-cli --version
シェルが正しいバイナリを使用しているか確認:
which llama-cli
llama-cli --version
バージョンが古い場合、システムが古いインストール済みのコピーを見つけています。buildディレクトリから直接バイナリを呼び出すか、インストール済みバージョンを更新してください。
Homebrew
brew update && brew upgrade llama.cpp
llama-cli --version
Homebrewパッケージがまだアップストリームに遅れている場合は、一時的にソースからビルドしてください。
Ollama
ollama pull gemma4
ollama run gemma4
Ollamaは管理されたgemma4モデルを維持しています。標準Gemma 4を実行したいだけなら、カスタムGGUFを管理するよりOllama経由の方が簡単です。
LM Studio
LM Studioの内蔵アップデーターで更新してください。現在のバージョンはgemma4アーキテクチャをサポートしています。
unknown model architecture: 'diffusion-gemma' の修正
このエラーは別物です。DiffusionGemmaのサポートは執筆時点でllama.cppのmainブランチにマージされていません。PR #24423にのみ存在し、このPRはllama-diffusion-cliという独立した専用バイナリも追加します。
llama.cppを最新公式リリースに更新しても解決しません。 必要なのは:
- PR #24423ブランチからビルドする、または
- DiffusionGemmaをすでにサポートする別のランタイムを使用する
オプションA:PR #24423からビルド
git clone https://github.com/ggml-org/llama.cpp
cd llama.cpp
git fetch origin pull/24423/head:diffusion-gemma-pr
git checkout diffusion-gemma-pr
# CPUのみ:
cmake -B build
cmake --build build --config Release -j
# NVIDIA CUDA:
cmake -B build -DGGML_CUDA=ON
cmake --build build --config Release -j
# 必要なバイナリ:
./build/bin/llama-diffusion-cli
注意:このブランチでもllama-cliではなくllama-diffusion-cliを使用する必要があります。DiffusionGemma GGUFにllama-cliを実行すると引き続き失敗します。
オプションB:別のランタイムを使用
| ランタイム | DiffusionGemmaサポート |
|---|---|
| Unsloth Studio | あり、2026年6月12日以降(v0.1.463-beta)。最も簡単。 |
| vLLM | あり、2026年6月10日以降。サービングに最適。 |
| HF Transformers | あり、Google公式ウェイト経由。 |
| Ollama | なし。Issue #16664オープン中。 |
| LM Studio | なし。Bug #2037オープン中。 |
効果のない対処法
- GGUFファイルの名前変更。アーキテクチャのメタデータはファイル内にあり、ファイル名にはありません。
- コンテキスト長やサンプリング設定の変更。ローダーは推論開始前に失敗しています。
- 別のプロンプトを試す。理由は同じです。
モデルファイルが有効かどうかの確認方法
./build/bin/llama-cli -m /path/to/model.gguf -p "こんにちは。" -n 10
| 結果 | 意味 |
|---|---|
| 正常にロード | ランタイムは最新。他のアプリが失敗する場合、そのアプリのランタイムが遅れている。 |
unknown model architecture: 'gemma4' |
ランタイムを更新する。 |
unknown model architecture: 'diffusion-gemma' |
PR #24423または別のランタイムが必要。 |
| その他のエラー | ファイルが不完全または信頼できないソース。 |
信頼できるGGUFソース:ggml-org、Unsloth、bartowski、mradermacher。
よくある質問
最新のllama.cppに更新してもdiffusion-gemmaエラーが出ます。なぜですか?
PRがマージされていないからです。最新のmainにはDiffusionGemmaサポートが含まれていません。PRブランチが特別に必要です。
PRブランチからビルドするのは安全ですか?
個人的なテストには問題ありません。本番環境では、プロジェクトの完全なレビュープロセスを経ていないプレリリースコードとして扱ってください。
llama-cliとllama-diffusion-cliで同じGGUFを使えますか?
いいえ。それぞれ異なるアーキテクチャを処理します。DiffusionGemma GGUFにはllama-diffusion-cliが必要です。標準Gemma 4 GGUFには標準llama-cliを使用します。
関連ガイド:
関連記事
Gemma 4 の記事群をそのまま辿り、今の判断にいちばん近い次の記事へ進んでください。

DiffusionGemmaはllama.cppで動作するか?実際の状況
標準のllama.cppはDiffusionGemmaを実行できません。サポートはPR #24423にあり、専用のllama-diffusion-cliバイナリが提供されます。現在実際に動作するものを説明します。

llama.cpp は Gemma 4 に対応している? GGUF の状況、修正、動作確認済みモデル
llama.cpp が Gemma 4 をサポートしているかという疑問に対し、公式 GGUF リンク、現在のサポート状況、そして「サポート済み」が具体的に何を意味するのかを詳しく回答します。

llama.cpp で Gemma 4 を実行する方法: GGUF 設定、ハードウェア、量子化ガイド
Gemma 4 を llama.cpp でローカル実行するために必要なすべて:ハードウェア対応表、コピー&ペーストで使えるビルドコマンド、量子化ガイド、マルチモーダルセットアップ。
次に何を読めばいいか迷っていますか?
ガイド一覧に戻って、モデル比較、ローカル導入、ハードウェア計画の3方向から続けて見ていけます。
