

Сравнение Model
GLM-4-32B-0414
против
Qwen3-30B-A3B-Thinking-2507
28 февр. 2026 г.

Цены
Input
$
0.27
/ M Tokens
$
0.09
/ M Tokens
Output
$
0.27
/ M Tokens
$
0.3
/ M Tokens
Метаданные
Создать на
7 апр. 2025 г.
29 июл. 2025 г.
Лицензия
MIT
APACHE-2.0
Поставщик
Z.ai
Qwen
Спецификация
Государство
Available
Available
Архитектура
GLM-4
Mixture-of-Experts
Калибровка
Да
Нет
Смешение экспертов
Нет
Да
Общее количество параметров
32B
30B
Активированные параметры
32B
3.3B
Мышление
Нет
Нет
Точность
FP8
FP8
Длина контекста
33K
262K
Максимум Tokens
33K
131K
поддерживается функциональность
Безсерверный
поддерживается
поддерживается
Безсерверный LoRA
Не поддерживается
Не поддерживается
Тонкая настройка
Не поддерживается
Не поддерживается
Embeddings
Не поддерживается
Не поддерживается
Rerankers
Не поддерживается
Не поддерживается
Поддержка Image Input
Не поддерживается
Не поддерживается
Режим JSON
поддерживается
поддерживается
Структурированные Outputs
Не поддерживается
Не поддерживается
Инструменты
поддерживается
поддерживается
Завершение погашения
Не поддерживается
Не поддерживается
Chat Префикс Заполнение
Не поддерживается
Не поддерживается
GLM-4-32B-0414в сравнении
Смотрите как GLM-4-32B-0414сравнивается с другими популярными моделями по ключевым параметрам.
ВС

GLM-4.6V
ВС

Qwen3-VL-32B-Instruct
ВС

Qwen3-VL-32B-Thinking
ВС

Qwen3-VL-8B-Instruct
ВС

Qwen3-VL-8B-Thinking
ВС

Qwen3-VL-30B-A3B-Instruct
ВС

Qwen3-VL-30B-A3B-Thinking
ВС

Qwen3-Omni-30B-A3B-Instruct
ВС

Ring-flash-2.0
ВС

Ling-flash-2.0
ВС

Qwen3-Omni-30B-A3B-Captioner
ВС

Qwen3-Omni-30B-A3B-Thinking
ВС

Qwen3-Next-80B-A3B-Instruct
ВС

Qwen3-Next-80B-A3B-Thinking
ВС

Ling-mini-2.0
ВС

Hunyuan-MT-7B
ВС
gpt-oss-120b
ВС
gpt-oss-20b
ВС

Qwen3-Coder-30B-A3B-Instruct
ВС

Qwen3-30B-A3B-Thinking-2507
