Модели

Продукты

Цены

Документация

Блог

О

Контакт

🎉 gemma-4-12B-it доступно на SiliconFlow. Попробуйте это СЕЙЧАС.

🎉 gemma-4-12B-it доступно на SiliconFlow. Попробуйте это СЕЙЧАС.

Модели

gemma-4-26B-A4B-it

gemma-4-26B-A4B-it

google/gemma-4-26B-A4B-it

Справочник API

О gemma-4-26B-A4B-it

Gemma 4 26B is Google DeepMind's latest open-source MoE model, built on a 26B-parameter Mixture of Experts architecture that activates only 3.8B parameters during inference for exceptionally fast token throughput. Purpose-built for advanced reasoning and agentic workflows, it ranks #6 among all open models on the Arena AI leaderboard — outperforming models up to 20x its size — with native function-calling, 256K context, and full Apache 2.0 licensing.

Доступный Serverless

Запускайте запросы немедленно, платите только за использование

За 1 миллион Tokens (Input/Output)

$

0.12

/ M Tokens

За 1 миллион Tokens (Input/Output)

$

0.4

/ M Tokens

Playground

Использование API

Эталон

Случай использования

Loading...

Метаданные

Создать на

7 апр. 2026 г.

Лицензия

APACHE 2.0

Поставщик

Google

HuggingFace

gemma-4-26B-A4B-it

Спецификация

Государство

Available

Архитектура

Mixture of Experts

Калибровка

Да

Смешение экспертов

Да

Общее количество параметров

31B

Активированные параметры

3.8B

Мышление

Нет

Точность

ФП8

Контекст length

262K

Максимум Tokens

262K

поддерживается функциональность

Безсерверный

поддерживается

Безсерверный LoRA

Не поддерживается

Тонкая настройка

Не поддерживается

Embeddings

Не поддерживается

Rerankers

Не поддерживается

Поддержка Image Input

поддерживается

Режим JSON

поддерживается

Структурированные Outputs

Не поддерживается

Инструменты

поддерживается

Завершение погашения

Не поддерживается

Chat Префикс Заполнение

Не поддерживается

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

Google

chat

gemma-4-12B-it

Выпуск: 9 июн. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.1

/ M Tokens

Output:

$

0.3

/ M Tokens

Google

chat

gemma-4-26B-A4B-it

Выпуск: 7 апр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.12

/ M Tokens

Output:

$

0.4

/ M Tokens

Google

chat

gemma-4-31B-it

Выпуск: 7 апр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.13

/ M Tokens

Output:

$

0.4

/ M Tokens

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность