

Сравнение Model
GLM-4-32B-0414
против
Qwen3-VL-32B-Thinking
28 февр. 2026 г.

Цены
Input
$
0.27
/ M Tokens
$
0.2
/ M Tokens
Output
$
0.27
/ M Tokens
$
1.5
/ M Tokens
Метаданные
Создать на
7 апр. 2025 г.
19 окт. 2025 г.
Лицензия
MIT
APACHE-2.0
Поставщик
Z.ai
Qwen
Спецификация
Государство
Available
Available
Архитектура
GLM-4
Dense and MoE
Калибровка
Да
Нет
Смешение экспертов
Нет
Да
Общее количество параметров
32B
32B
Активированные параметры
32B
32B
Мышление
Нет
Нет
Точность
FP8
FP8
Длина контекста
33K
262K
Максимум Tokens
33K
262K
поддерживается функциональность
Безсерверный
поддерживается
поддерживается
Безсерверный LoRA
Не поддерживается
Не поддерживается
Тонкая настройка
Не поддерживается
Не поддерживается
Embeddings
Не поддерживается
Не поддерживается
Rerankers
Не поддерживается
Не поддерживается
Поддержка Image Input
Не поддерживается
Не поддерживается
Режим JSON
поддерживается
поддерживается
Структурированные Outputs
Не поддерживается
Не поддерживается
Инструменты
поддерживается
поддерживается
Завершение погашения
Не поддерживается
Не поддерживается
Chat Префикс Заполнение
Не поддерживается
поддерживается
GLM-4-32B-0414в сравнении
Смотрите как GLM-4-32B-0414сравнивается с другими популярными моделями по ключевым параметрам.
ВС

GLM-4.6V
ВС

Qwen3-VL-32B-Instruct
ВС

Qwen3-VL-32B-Thinking
ВС

Qwen3-VL-8B-Instruct
ВС

Qwen3-VL-8B-Thinking
ВС

Qwen3-VL-30B-A3B-Instruct
ВС

Qwen3-VL-30B-A3B-Thinking
ВС

Qwen3-Omni-30B-A3B-Instruct
ВС

Ring-flash-2.0
ВС

Ling-flash-2.0
ВС

Qwen3-Omni-30B-A3B-Captioner
ВС

Qwen3-Omni-30B-A3B-Thinking
ВС

Qwen3-Next-80B-A3B-Instruct
ВС

Qwen3-Next-80B-A3B-Thinking
ВС

Ling-mini-2.0
ВС

Hunyuan-MT-7B
ВС
gpt-oss-120b
ВС
gpt-oss-20b
ВС

Qwen3-Coder-30B-A3B-Instruct
ВС

Qwen3-30B-A3B-Thinking-2507
