模型

產品

定價

文檔

部落格

關於

聯繫

🎉 gemma-4-12B-it可在 SiliconFlow 上使用。現在就試試看。

🎉 gemma-4-12B-it可在 SiliconFlow 上使用。現在就試試看。

模型

gemma-4-12B-it

gemma-4-12B-it

google/gemma-4-12B-it

API 參考

關於gemma-4-12B-it

Gemma 4 26B is Google DeepMind's latest open-source MoE model, built on a 26B-parameter Mixture of Experts architecture that activates only 3.8B parameters during inference for exceptionally fast token throughput. Purpose-built for advanced reasoning and agentic workflows, it ranks #6 among all open models on the Arena AI leaderboard — outperforming models up to 20x its size — with native function-calling, 256K context, and full Apache 2.0 licensing.

可用的無伺服器

立即運行查詢，僅按使用量付費

每百萬 Tokens（輸入/輸出）

$

0.1

/ M Tokens

每百萬 Tokens（輸入/輸出）

$

0.3

/ M Tokens

體驗中心

API 使用

基準

用例

Loading...

元數據

創建於

2026年6月9日

許可證

供應商

Google

HuggingFace

規格

狀態

Available

架構

經過校準的

否

專家並行

否

總參數

31B

啟用的參數

推理

否

精度

FP8

上下文長度

262K

最大輸出長度

262K

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

支持

JSON 模式

支持

結構化輸出

不支持

工具

支持

中間填充補全

不支持

聊天前綴補全

不支持

與其他模型比較

看看這個模型與其他模型的對比如何。

Google

chat

gemma-4-12B-it

發行日期：2026年6月9日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.1

/ M Tokens

輸出：

$

0.3

/ M Tokens

Google

chat

gemma-4-26B-A4B-it

發行日期：2026年4月7日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.12

/ M Tokens

輸出：

$

0.4

/ M Tokens

Google

chat

gemma-4-31B-it

發行日期：2026年4月7日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.13

/ M Tokens

輸出：

$

0.4

/ M Tokens

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·