モデル

製品

価格

ドキュメント

ブログ

約

連絡

🎉 gemma-4-31B-itはSiliconFlowで利用可能です。今すぐお試しください。

🎉 gemma-4-31B-itはSiliconFlowで利用可能です。今すぐお試しください。

モデル

gemma-4-26B-A4B-it

gemma-4-26B-A4B-it

google/gemma-4-26B-A4B-it

APIリファレンス

約gemma-4-26B-A4B-it

Gemma 4 26B is Google DeepMind's latest open-source MoE model, built on a 26B-parameter Mixture of Experts architecture that activates only 3.8B parameters during inference for exceptionally fast token throughput. Purpose-built for advanced reasoning and agentic workflows, it ranks #6 among all open models on the Arena AI leaderboard — outperforming models up to 20x its size — with native function-calling, 256K context, and full Apache 2.0 licensing.

利用可能な Serverless

クエリをすぐに実行し、使用量のみを支払います

100万トークン（Input/Output）ごとに

$

0.12

/ M Tokens

100万トークン（Input/Output）ごとに

$

0.4

/ M Tokens

Playground

APIの使用

ベンチマーク

ユースケース

Loading...

メタデータ

作成する

2026/04/07

ライセンス

APACHE 2.0

プロバイダー

Google

ハギングフェイス

gemma-4-26B-A4B-it

仕様

州

Available

建築

Mixture of Experts

キャリブレートされた

はい

専門家の混合

はい

合計パラメータ

31B

アクティブ化されたパラメータ

3.8B

推論

いいえ

Precision

FP8

コンテキスト長

262K

Max Tokens

262K

対応機能

Serverless

対応

Serverless LoRA

サポートされていません

Fine-tuning

サポートされていません

Embeddings

サポートされていません

Rerankers

サポートされていません

Image入力をサポートする

対応

JSON Mode

対応

構造化されたOutputs

サポートされていません

ツール

対応

Fim Completion

サポートされていません

Chat Prefix Completion

サポートされていません

他のModelsと比較

他のモデルに対してこのModelがどのように比較されるかを見てください。

Google

chat

gemma-4-26B-A4B-it

リリース日：2026/04/07

Total Context:

262K

Max output:

262K

Input：

$

0.12

/ M Tokens

Output:

$

0.4

/ M Tokens

Google

chat

gemma-4-31B-it

リリース日：2026/04/07

Total Context:

262K

Max output:

262K

Input：

$

0.13

/ M Tokens

Output:

$

0.4

/ M Tokens

AI開発を加速する準備はできていますか？

AI開発を加速する準備はできていますか？

AI開発を加速する準備はできていますか？

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー