DeepSeek-R1-Distill-Qwen-32B
О DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Qwen-32B является дистиллированной Model на основе Qwen2.5-32B. Модель была тонко настроена с использованием 800 тысяч отобранных образцов, сгенерированных DeepSeek-R1, и демонстрирует исключительную производительность в задачах по математике, программированию и рассуждениям. Она достигла впечатляющих результатов в различных тестах, включая AIME 2024, MATH-500 и GPQA Diamond, с заметной точностью 94,3% на MATH-500, демонстрируя её сильные математические способности.
Исследуйте, как исключительные возможности DeepSeek-R1-Distill-Qwen-32B в области логических заключений, математики и программирования могут решать сложные, реальные проблемы.
Продвинутое научное решение проблем
Используйте превосходные математические и логические возможности DeepSeek-R1-Distill-Qwen-32B для решения сложных научных задач, от теоретической физики до биохимического моделирования.
Пример использования:
"Помог команде по квантовым вычислениям, разработав новые алгоритмы для коррекции ошибок, что значительно ускорило их исследовательский процесс."
Многоязычный анализ и усовершенствование кода
Выходите за рамки базовой отладки. Анализируйте крупные кодовые базы на различных языках, чтобы выявить незаметные логические ошибки, оптимизировать алгоритмы и повысить безопасность систем.
Пример использования:
"Обнаружилась критическая гонка в приложении на Rust блокчейн, отслеживая пути одновременного выполнения, предоставив точное и безопасное исправление."
Количественная финансовая стратегия
Проводите глубокий количественный анализ обширных финансовых данных, идентифицируйте сложные рыночные модели и разработайте надежные алгоритмические стратегии торговли или инвестирования.
Пример использования:
"Разработан алгоритм высокочастотной торговли, анализирующий исторические рыночные данные и экономические индикаторы, превосходящий традиционные модели на 15%."
Интеллектуальные системы и аудиты соответствия
Автоматизируйте аудит сложных систем, от регуляторных документов до сложных инженерных проектов, обеспечивая соответствие и выявление критических уязвимостей.
Пример использования:
"Проведен аудит крупной облачной инфраструктуры на соответствие GDPR и SOC 2, выявив несколько несоответствий и предложив шаги по их устранению."
Метаданные
Спецификация
Государство
Deprecated
Архитектура
Dense Transformer
Калибровка
Нет
Смешение экспертов
Нет
Общее количество параметров
32B
Активированные параметры
32B
Мышление
Нет
Точность
ФП8
Контекст length
131K
Максимум Tokens
131K
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.
DeepSeek
chat
DeepSeek-V3.2
Выпуск: 4 дек. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Выпуск: 10 окт. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Выпуск: 29 сент. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Выпуск: 25 авг. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Выпуск: 26 дек. 2024 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Выпуск: 28 мая 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
131K
Максимальный Output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
131K
Максимальный Output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
33K
Максимальный Output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
