llama.cppで「unknown model architecture」を修正する：gemma4とdiffusion-gemma

以下のいずれかのエラーが出た場合：

error loading model: unknown model architecture: 'gemma4'

error loading model: unknown model architecture: 'diffusion-gemma'

見た目は似ていますが、原因はまったく異なります。同じ修正方法を両方に適用しないでください。

どちらのエラーですか？

エラー文字列	意味	修正方法
`unknown model architecture: 'gemma4'`	ランタイムがGemma 4リリース前のバージョン	llama.cpp、Ollama、またはアプリを更新する
`unknown model architecture: 'diffusion-gemma'`	DiffusionGemmaはリリース済みのllama.cppに含まれていない	PR #24423からビルドするか別のランタイムを使用する

重要な違い：gemma4のサポートはllama.cppのmainブランチと現在のOllama/LM Studioリリースに存在します。更新すれば解決します。diffusion-gemmaのサポートは公式リリースにはなく、マージされていないプルリクエスト(#24423)にのみ存在します。最新の公式バージョンに更新してもこれは解決しません。

`unknown model architecture: 'gemma4'` の修正

このエラーはランタイムがGemma 4の2026年4月リリース前のものであることを意味します。修正方法は更新です。

llama.cpp

cd llama.cpp
git pull
cmake -B build
cmake --build build --config Release -j

# 新しいバイナリを確認
./build/bin/llama-cli --version

シェルが正しいバイナリを使用しているか確認：

which llama-cli
llama-cli --version

バージョンが古い場合、システムが古いインストール済みのコピーを見つけています。buildディレクトリから直接バイナリを呼び出すか、インストール済みバージョンを更新してください。

Homebrew

brew update && brew upgrade llama.cpp
llama-cli --version

Homebrewパッケージがまだアップストリームに遅れている場合は、一時的にソースからビルドしてください。

Ollama

ollama pull gemma4
ollama run gemma4

Ollamaは管理されたgemma4モデルを維持しています。標準Gemma 4を実行したいだけなら、カスタムGGUFを管理するよりOllama経由の方が簡単です。

LM Studio

LM Studioの内蔵アップデーターで更新してください。現在のバージョンはgemma4アーキテクチャをサポートしています。

`unknown model architecture: 'diffusion-gemma'` の修正

このエラーは別物です。DiffusionGemmaのサポートは執筆時点でllama.cppのmainブランチにマージされていません。PR #24423にのみ存在し、このPRはllama-diffusion-cliという独立した専用バイナリも追加します。

llama.cppを最新公式リリースに更新しても解決しません。 必要なのは：

PR #24423ブランチからビルドする、または
DiffusionGemmaをすでにサポートする別のランタイムを使用する

オプションA：PR #24423からビルド

git clone https://github.com/ggml-org/llama.cpp
cd llama.cpp
git fetch origin pull/24423/head:diffusion-gemma-pr
git checkout diffusion-gemma-pr

# CPUのみ：
cmake -B build
cmake --build build --config Release -j

# NVIDIA CUDA：
cmake -B build -DGGML_CUDA=ON
cmake --build build --config Release -j

# 必要なバイナリ：
./build/bin/llama-diffusion-cli

注意：このブランチでもllama-cliではなくllama-diffusion-cliを使用する必要があります。DiffusionGemma GGUFにllama-cliを実行すると引き続き失敗します。

オプションB：別のランタイムを使用

ランタイム	DiffusionGemmaサポート
Unsloth Studio	あり、2026年6月12日以降(v0.1.463-beta)。最も簡単。
vLLM	あり、2026年6月10日以降。サービングに最適。
HF Transformers	あり、Google公式ウェイト経由。
Ollama	なし。Issue #16664オープン中。
LM Studio	なし。Bug #2037オープン中。

効果のない対処法

GGUFファイルの名前変更。アーキテクチャのメタデータはファイル内にあり、ファイル名にはありません。
コンテキスト長やサンプリング設定の変更。ローダーは推論開始前に失敗しています。
別のプロンプトを試す。理由は同じです。

モデルファイルが有効かどうかの確認方法

./build/bin/llama-cli -m /path/to/model.gguf -p "こんにちは。" -n 10

結果	意味
正常にロード	ランタイムは最新。他のアプリが失敗する場合、そのアプリのランタイムが遅れている。
`unknown model architecture: 'gemma4'`	ランタイムを更新する。
`unknown model architecture: 'diffusion-gemma'`	PR #24423または別のランタイムが必要。
その他のエラー	ファイルが不完全または信頼できないソース。

信頼できるGGUFソース：ggml-org、Unsloth、bartowski、mradermacher。

よくある質問

最新のllama.cppに更新してもdiffusion-gemmaエラーが出ます。なぜですか？
PRがマージされていないからです。最新のmainにはDiffusionGemmaサポートが含まれていません。PRブランチが特別に必要です。

PRブランチからビルドするのは安全ですか？
個人的なテストには問題ありません。本番環境では、プロジェクトの完全なレビュープロセスを経ていないプレリリースコードとして扱ってください。

llama-cliとllama-diffusion-cliで同じGGUFを使えますか？
いいえ。それぞれ異なるアーキテクチャを処理します。DiffusionGemma GGUFにはllama-diffusion-cliが必要です。標準Gemma 4 GGUFには標準llama-cliを使用します。

llama.cppで「unknown model architecture」を修正する：gemma4とdiffusion-gemma

どちらのエラーですか？

`unknown model architecture: 'gemma4'` の修正

llama.cpp

Homebrew

Ollama

LM Studio

`unknown model architecture: 'diffusion-gemma'` の修正

オプションA：PR #24423からビルド

オプションB：別のランタイムを使用

効果のない対処法

モデルファイルが有効かどうかの確認方法

よくある質問

関連記事

DiffusionGemma + llama.cpp：動作します — 実行方法はこちら（2026年）

llama.cpp は Gemma 4 に対応している？ GGUF の状況、修正、動作確認済みモデル

llama.cpp で Gemma 4 を実行する：完全 GGUF セットアップガイド（2026年）

次に何を読めばいいか迷っていますか？

llama.cppで「unknown model architecture」を修正する：gemma4とdiffusion-gemma

どちらのエラーですか？

unknown model architecture: 'gemma4' の修正

llama.cpp

Homebrew

Ollama

LM Studio

unknown model architecture: 'diffusion-gemma' の修正

オプションA：PR #24423からビルド

オプションB：別のランタイムを使用

効果のない対処法

モデルファイルが有効かどうかの確認方法

よくある質問

関連記事

DiffusionGemma + llama.cpp：動作します — 実行方法はこちら（2026年）

llama.cpp は Gemma 4 に対応している？ GGUF の状況、修正、動作確認済みモデル

llama.cpp で Gemma 4 を実行する：完全 GGUF セットアップガイド（2026年）

次に何を読めばいいか迷っていますか？

`unknown model architecture: 'gemma4'` の修正

`unknown model architecture: 'diffusion-gemma'` の修正