

Сравнение Model
GLM-5
против
Ring-flash-2.0
15 февр. 2026 г.

Цены
Input
$
0.3
/ M Tokens
$
0.14
/ M Tokens
Output
$
2.55
/ M Tokens
$
0.57
/ M Tokens
Метаданные
Создать на
11 февр. 2026 г.
19 сент. 2025 г.
Лицензия
MIT
MIT LICENSE
Поставщик
Z.ai
inclusionAI
Спецификация
Государство
Available
Available
Архитектура
Mixture of Experts (MoE) with DeepSeek Sparse Attention (DSA) and asynchronous RL stack
Mixture-of-Experts (MoE) with 1/32 expert activation ratio and MTP layers, featuring low activation and high sparsity design
Калибровка
Нет
Да
Смешение экспертов
Да
Да
Общее количество параметров
750B
100B
Активированные параметры
40B
6.1B
Мышление
Нет
Нет
Точность
FP8
FP8
Длина контекста
205K
131K
Максимум Tokens
131K
131K
поддерживается функциональность
Безсерверный
поддерживается
поддерживается
Безсерверный LoRA
Не поддерживается
Не поддерживается
Тонкая настройка
Не поддерживается
Не поддерживается
Embeddings
Не поддерживается
Не поддерживается
Rerankers
Не поддерживается
Не поддерживается
Поддержка Image Input
Не поддерживается
Не поддерживается
Режим JSON
Не поддерживается
Не поддерживается
Структурированные Outputs
Не поддерживается
Не поддерживается
Инструменты
поддерживается
Не поддерживается
Завершение погашения
Не поддерживается
Не поддерживается
Chat Префикс Заполнение
Не поддерживается
поддерживается
GLM-5в сравнении
Смотрите как GLM-5сравнивается с другими популярными моделями по ключевым параметрам.



