DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-14B

О DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-14B — это дистиллированная модель, основанная на Qwen2.5-14B. Модель была доработана с использованием 800 тысяч отобранных образцов, созданных DeepSeek-R1, и демонстрирует сильные способности к аргументации. Она достигла впечатляющих результатов на различных тестах, включая 93,9% точности на MATH-500, 69,7% проходного балла на AIME 2024 и рейтинг 1481 на CodeForces, демонстрируя свои мощные способности в решении задач по математике и программированию.

Изучите, как мощное, сокращенное рассуждение DeepSeek-R1-Distill-Qwen-14B может быть применено для решения сложных реальных проблем с эффективностью и Precision.

Моделирование в области математики и физики

Используйте DeepSeek-R1-Distill-Qwen-14B для сложных математических выводов, сложных физических симуляций и строгого доказательства, ускоряя научные и инженерные достижения.

Пример использования:

"Помощь инженеру-аэрокосмику в выводе оптимальных уравнений траектории для запуска спутника, сокращая время ручных расчетов на 70% и улучшая точность Model."

Анализ и рефакторинг кода с Precision

Анализ крупных кодовых баз для выявления тонких логических ошибок, оптимизации алгоритмов и предложения надежных стратегий рефакторинга на различных языках программирования.

Пример использования:

"Выявление и предложение более эффективной структуры данных для критического микросервиса на Go, сокращая задержку на 15% и улучшая использование ресурсов."

Разработка стратегий алгоритмической торговли

Проектирование и тестирование сложных алгоритмических торговых стратегий путем анализа рыночных данных, выявления сложных шаблонов и вывода причинно-следственных связей для оптимальных инвестиционных решений.

Пример использования:

"Разработка алгоритма высокочастотной торговли для криптовалютных рынков, предсказывающего движения цен с повышенной точностью за счет выявления тонких корреляций между активами."

Оценка уязвимостей интеллектуальных систем

Автоматический аудит сложных программных систем, смарт-контрактов или конфигураций сетей для выявления логических уязвимостей, недостатков безопасности и отклонений от стандартов с использованием глубокого анализа.

Пример использования:

"Обнаружение критической уязвимости повторной записи в смарт-контракте на Solidity путем тщательного отслеживания потоков транзакций, предотвращая потенциальную потерю активов в протоколе DeFi."

Метаданные

Создать на

20 янв. 2025 г.

Лицензия

MIT LICENSE

Поставщик

DeepSeek

Спецификация

Государство

Deprecated

Архитектура

Калибровка

Нет

Смешение экспертов

Нет

Общее количество параметров

14B

Активированные параметры

14B

Мышление

Нет

Точность

ФП8

Контекст length

131K

Максимум Tokens

131K

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

DeepSeek

chat

DeepSeek-V3.2

Выпуск: 4 дек. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

0.42

/ M Tokens

DeepSeek

chat

DeepSeek-V3.2-Exp

Выпуск: 10 окт. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

0.41

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1-Terminus

Выпуск: 29 сент. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

1

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1

Выпуск: 25 авг. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

1

/ M Tokens

DeepSeek

chat

DeepSeek-V3

Выпуск: 26 дек. 2024 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.25

/ M Tokens

Output:

$

1

/ M Tokens

DeepSeek

chat

DeepSeek-R1

Выпуск: 28 мая 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.5

/ M Tokens

Output:

$

2.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-32B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

131K

Максимальный Output:

131K

Input:

$

0.18

/ M Tokens

Output:

$

0.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-14B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

131K

Максимальный Output:

131K

Input:

$

0.1

/ M Tokens

Output:

$

0.1

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-7B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

33K

Максимальный Output:

16K

Input:

$

0.05

/ M Tokens

Output:

$

0.05

/ M Tokens

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Russian (Russia)
Russian (Russia)
Russian (Russia)