Gemma 4 ガイド

llama.cppで「unknown model architecture」を修正する:gemma4とdiffusion-gemma

約 6 分
gemma 4llama.cppggufトラブルシューティングローカルllm
llama.cppで「unknown model architecture」を修正する:gemma4とdiffusion-gemma

以下のいずれかのエラーが出た場合:

error loading model: unknown model architecture: 'gemma4'
error loading model: unknown model architecture: 'diffusion-gemma'

見た目は似ていますが、原因はまったく異なります。同じ修正方法を両方に適用しないでください。

どちらのエラーですか?

エラー文字列 意味 修正方法
unknown model architecture: 'gemma4' ランタイムがGemma 4リリース前のバージョン llama.cpp、Ollama、またはアプリを更新する
unknown model architecture: 'diffusion-gemma' DiffusionGemmaはリリース済みのllama.cppに含まれていない PR #24423からビルドするか別のランタイムを使用する

重要な違い:gemma4のサポートはllama.cppのmainブランチと現在のOllama/LM Studioリリースに存在します。更新すれば解決します。diffusion-gemmaのサポートは公式リリースにはなく、マージされていないプルリクエスト(#24423)にのみ存在します。最新の公式バージョンに更新してもこれは解決しません。


unknown model architecture: 'gemma4' の修正

このエラーはランタイムがGemma 4の2026年4月リリース前のものであることを意味します。修正方法は更新です。

llama.cpp

cd llama.cpp
git pull
cmake -B build
cmake --build build --config Release -j

# 新しいバイナリを確認
./build/bin/llama-cli --version

シェルが正しいバイナリを使用しているか確認:

which llama-cli
llama-cli --version

バージョンが古い場合、システムが古いインストール済みのコピーを見つけています。buildディレクトリから直接バイナリを呼び出すか、インストール済みバージョンを更新してください。

Homebrew

brew update && brew upgrade llama.cpp
llama-cli --version

Homebrewパッケージがまだアップストリームに遅れている場合は、一時的にソースからビルドしてください。

Ollama

ollama pull gemma4
ollama run gemma4

Ollamaは管理されたgemma4モデルを維持しています。標準Gemma 4を実行したいだけなら、カスタムGGUFを管理するよりOllama経由の方が簡単です。

LM Studio

LM Studioの内蔵アップデーターで更新してください。現在のバージョンはgemma4アーキテクチャをサポートしています。


unknown model architecture: 'diffusion-gemma' の修正

このエラーは別物です。DiffusionGemmaのサポートは執筆時点でllama.cppのmainブランチにマージされていません。PR #24423にのみ存在し、このPRはllama-diffusion-cliという独立した専用バイナリも追加します。

llama.cppを最新公式リリースに更新しても解決しません。 必要なのは:

  1. PR #24423ブランチからビルドする、または
  2. DiffusionGemmaをすでにサポートする別のランタイムを使用する

オプションA:PR #24423からビルド

git clone https://github.com/ggml-org/llama.cpp
cd llama.cpp
git fetch origin pull/24423/head:diffusion-gemma-pr
git checkout diffusion-gemma-pr

# CPUのみ:
cmake -B build
cmake --build build --config Release -j

# NVIDIA CUDA:
cmake -B build -DGGML_CUDA=ON
cmake --build build --config Release -j

# 必要なバイナリ:
./build/bin/llama-diffusion-cli

注意:このブランチでもllama-cliではなくllama-diffusion-cliを使用する必要があります。DiffusionGemma GGUFにllama-cliを実行すると引き続き失敗します。

オプションB:別のランタイムを使用

ランタイム DiffusionGemmaサポート
Unsloth Studio あり、2026年6月12日以降(v0.1.463-beta)。最も簡単。
vLLM あり、2026年6月10日以降。サービングに最適。
HF Transformers あり、Google公式ウェイト経由。
Ollama なし。Issue #16664オープン中。
LM Studio なし。Bug #2037オープン中。

効果のない対処法

  • GGUFファイルの名前変更。アーキテクチャのメタデータはファイル内にあり、ファイル名にはありません。
  • コンテキスト長やサンプリング設定の変更。ローダーは推論開始前に失敗しています。
  • 別のプロンプトを試す。理由は同じです。

モデルファイルが有効かどうかの確認方法

./build/bin/llama-cli -m /path/to/model.gguf -p "こんにちは。" -n 10
結果 意味
正常にロード ランタイムは最新。他のアプリが失敗する場合、そのアプリのランタイムが遅れている。
unknown model architecture: 'gemma4' ランタイムを更新する。
unknown model architecture: 'diffusion-gemma' PR #24423または別のランタイムが必要。
その他のエラー ファイルが不完全または信頼できないソース。

信頼できるGGUFソース:ggml-org、Unsloth、bartowski、mradermacher。


よくある質問

最新のllama.cppに更新してもdiffusion-gemmaエラーが出ます。なぜですか?
PRがマージされていないからです。最新のmainにはDiffusionGemmaサポートが含まれていません。PRブランチが特別に必要です。

PRブランチからビルドするのは安全ですか?
個人的なテストには問題ありません。本番環境では、プロジェクトの完全なレビュープロセスを経ていないプレリリースコードとして扱ってください。

llama-clillama-diffusion-cliで同じGGUFを使えますか?
いいえ。それぞれ異なるアーキテクチャを処理します。DiffusionGemma GGUFにはllama-diffusion-cliが必要です。標準Gemma 4 GGUFには標準llama-cliを使用します。

関連ガイド:

関連記事

Gemma 4 の記事群をそのまま辿り、今の判断にいちばん近い次の記事へ進んでください。

次に何を読めばいいか迷っていますか?

ガイド一覧に戻って、モデル比較、ローカル導入、ハードウェア計画の3方向から続けて見ていけます。