
Сравнение Model
DeepSeek-R1-Distill-Qwen-14B
против
Qwen2.5-32B-Instruct
10 февр. 2026 г.

Цены
Input
$
0.1
/ M Tokens
$
0.18
/ M Tokens
Output
$
0.1
/ M Tokens
$
0.18
/ M Tokens
Метаданные
Создать на
20 янв. 2025 г.
17 сент. 2024 г.
Лицензия
MIT LICENSE
APACHE-2.0
Поставщик
DeepSeek
Qwen
Спецификация
Государство
Available
Available
Архитектура
Dense
transformers with RoPE, SwiGLU, RMSNorm, and Attention QKV bias
Калибровка
Нет
Нет
Смешение экспертов
Нет
Да
Общее количество параметров
14B
32B
Активированные параметры
14B
32.5B
Мышление
Нет
Нет
Точность
FP8
FP8
Длина контекста
131K
33K
Максимум Tokens
131K
4K
поддерживается функциональность
Безсерверный
поддерживается
поддерживается
Безсерверный LoRA
Не поддерживается
Не поддерживается
Тонкая настройка
Не поддерживается
Не поддерживается
Embeddings
Не поддерживается
Не поддерживается
Rerankers
Не поддерживается
Не поддерживается
Поддержка Image Input
Не поддерживается
Не поддерживается
Режим JSON
поддерживается
поддерживается
Структурированные Outputs
Не поддерживается
Не поддерживается
Инструменты
поддерживается
поддерживается
Завершение погашения
поддерживается
Не поддерживается
Chat Префикс Заполнение
Не поддерживается
поддерживается
DeepSeek-R1-Distill-Qwen-14Bв сравнении
Смотрите как DeepSeek-R1-Distill-Qwen-14Bсравнивается с другими популярными моделями по ключевым параметрам.
ВС

Qwen3-VL-32B-Instruct
ВС

Qwen3-VL-32B-Thinking
ВС

Qwen3-VL-8B-Instruct
ВС

Qwen3-VL-8B-Thinking
ВС

Qwen3-VL-30B-A3B-Instruct
ВС

Qwen3-VL-30B-A3B-Thinking
ВС

Qwen3-Omni-30B-A3B-Instruct
ВС

Qwen3-Omni-30B-A3B-Captioner
ВС

Qwen3-Omni-30B-A3B-Thinking
ВС

Qwen3-Next-80B-A3B-Instruct
ВС

Qwen3-Next-80B-A3B-Thinking
ВС

Ling-mini-2.0
ВС

Hunyuan-MT-7B
ВС
gpt-oss-20b
ВС

Qwen3-Coder-30B-A3B-Instruct
ВС

Qwen3-30B-A3B-Thinking-2507
ВС

Qwen3-30B-A3B-Instruct-2507
ВС

GLM-4.1V-9B-Thinking
ВС

Hunyuan-A13B-Instruct
ВС

Qwen3-14B
