

Сравнение Model
QwQ-32B
против
Qwen3-30B-A3B-Thinking-2507
28 февр. 2026 г.

Цены
Input
$
0.15
/ M Tokens
$
0.09
/ M Tokens
Output
$
0.58
/ M Tokens
$
0.3
/ M Tokens
Метаданные
Создать на
5 мар. 2025 г.
29 июл. 2025 г.
Лицензия
APACHE-2.0
APACHE-2.0
Поставщик
Qwen
Qwen
Спецификация
Государство
Available
Available
Архитектура
transformers with RoPE, SwiGLU, RMSNorm, and Attention QKV bias, with 64 layers and GQA (40 Q attention heads, 8 for KV)
Mixture-of-Experts
Калибровка
Нет
Нет
Смешение экспертов
Нет
Да
Общее количество параметров
32B
30B
Активированные параметры
32.5B
3.3B
Мышление
Нет
Нет
Точность
FP8
FP8
Длина контекста
131K
262K
Максимум Tokens
131K
131K
поддерживается функциональность
Безсерверный
поддерживается
поддерживается
Безсерверный LoRA
Не поддерживается
Не поддерживается
Тонкая настройка
Не поддерживается
Не поддерживается
Embeddings
Не поддерживается
Не поддерживается
Rerankers
Не поддерживается
Не поддерживается
Поддержка Image Input
Не поддерживается
Не поддерживается
Режим JSON
Не поддерживается
поддерживается
Структурированные Outputs
Не поддерживается
Не поддерживается
Инструменты
поддерживается
поддерживается
Завершение погашения
Не поддерживается
Не поддерживается
Chat Префикс Заполнение
Не поддерживается
Не поддерживается
QwQ-32Bв сравнении
Смотрите как QwQ-32Bсравнивается с другими популярными моделями по ключевым параметрам.
ВС

Qwen3-VL-32B-Instruct
ВС

Qwen3-VL-32B-Thinking
ВС

Qwen3-VL-8B-Instruct
ВС

Qwen3-VL-8B-Thinking
ВС

Qwen3-VL-30B-A3B-Instruct
ВС

Qwen3-VL-30B-A3B-Thinking
ВС

Qwen3-Omni-30B-A3B-Instruct
ВС

Ring-flash-2.0
ВС

Qwen3-Omni-30B-A3B-Captioner
ВС

Qwen3-Omni-30B-A3B-Thinking
ВС

Qwen3-Next-80B-A3B-Instruct
ВС

Qwen3-Next-80B-A3B-Thinking
ВС
gpt-oss-120b
ВС
gpt-oss-20b
ВС

Qwen3-Coder-30B-A3B-Instruct
ВС

Qwen3-30B-A3B-Thinking-2507
ВС

Qwen3-30B-A3B-Instruct-2507
ВС

Qwen3-14B
ВС

Qwen3-30B-A3B
ВС

Qwen3-32B
