DeepSeek-R1-Distill-Qwen-14B
О DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-14B — это дистиллированная модель, основанная на Qwen2.5-14B. Модель была доработана с использованием 800 тысяч отобранных образцов, созданных DeepSeek-R1, и демонстрирует сильные способности к аргументации. Она достигла впечатляющих результатов на различных тестах, включая 93,9% точности на MATH-500, 69,7% проходного балла на AIME 2024 и рейтинг 1481 на CodeForces, демонстрируя свои мощные способности в решении задач по математике и программированию.
Изучите, как мощное, сокращенное рассуждение DeepSeek-R1-Distill-Qwen-14B может быть применено для решения сложных реальных проблем с эффективностью и Precision.
Моделирование в области математики и физики
Используйте DeepSeek-R1-Distill-Qwen-14B для сложных математических выводов, сложных физических симуляций и строгого доказательства, ускоряя научные и инженерные достижения.
Пример использования:
"Помощь инженеру-аэрокосмику в выводе оптимальных уравнений траектории для запуска спутника, сокращая время ручных расчетов на 70% и улучшая точность Model."
Анализ и рефакторинг кода с Precision
Анализ крупных кодовых баз для выявления тонких логических ошибок, оптимизации алгоритмов и предложения надежных стратегий рефакторинга на различных языках программирования.
Пример использования:
"Выявление и предложение более эффективной структуры данных для критического микросервиса на Go, сокращая задержку на 15% и улучшая использование ресурсов."
Разработка стратегий алгоритмической торговли
Проектирование и тестирование сложных алгоритмических торговых стратегий путем анализа рыночных данных, выявления сложных шаблонов и вывода причинно-следственных связей для оптимальных инвестиционных решений.
Пример использования:
"Разработка алгоритма высокочастотной торговли для криптовалютных рынков, предсказывающего движения цен с повышенной точностью за счет выявления тонких корреляций между активами."
Оценка уязвимостей интеллектуальных систем
Автоматический аудит сложных программных систем, смарт-контрактов или конфигураций сетей для выявления логических уязвимостей, недостатков безопасности и отклонений от стандартов с использованием глубокого анализа.
Пример использования:
"Обнаружение критической уязвимости повторной записи в смарт-контракте на Solidity путем тщательного отслеживания потоков транзакций, предотвращая потенциальную потерю активов в протоколе DeFi."
Метаданные
Создать на
20 янв. 2025 г.
Лицензия
MIT LICENSE
Поставщик
DeepSeek
HuggingFace
Спецификация
Государство
Deprecated
Архитектура
Калибровка
Нет
Смешение экспертов
Нет
Общее количество параметров
14B
Активированные параметры
14B
Мышление
Нет
Точность
ФП8
Контекст length
131K
Максимум Tokens
131K
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.
DeepSeek
chat
DeepSeek-V3.2
Выпуск: 4 дек. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Выпуск: 10 окт. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Выпуск: 29 сент. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Выпуск: 25 авг. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Выпуск: 26 дек. 2024 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Выпуск: 28 мая 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
131K
Максимальный Output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
131K
Максимальный Output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
33K
Максимальный Output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
