DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

О DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B представляет собой дистиллированную модель, основанную на Qwen2.5-Math-7B. Модель была тонко настроена с использованием 800 тысяч курированных примеров, созданных DeepSeek-R1, и демонстрирует сильные способности к рассуждению. Она достигла впечатляющих результатов в различных бенчмарках, включая 92,8% точности на MATH-500, 55,5% проходного балла на AIME 2024 и рейтинг 1189 на CodeForces, показывая выдающиеся математические и программные способности для модели масштаба 7B.

Доступный Serverless

Запускайте запросы немедленно, платите только за использование

$

0.05

/

$

0.05

За 1 миллион Tokens (Input/Output)

Метаданные

Создать на

20 янв. 2025 г.

Лицензия

MIT LICENSE

Поставщик

DeepSeek

Спецификация

Государство

Available

Архитектура

Калибровка

Нет

Смешение экспертов

Нет

Общее количество параметров

7B

Активированные параметры

7B

Мышление

Нет

Точность

ФП8

Контекст length

33K

Максимум Tokens

16K

поддерживается функциональность

Безсерверный

поддерживается

Безсерверный LoRA

Не поддерживается

Тонкая настройка

Не поддерживается

Embeddings

Не поддерживается

Rerankers

Не поддерживается

Поддержка Image Input

Не поддерживается

Режим JSON

поддерживается

Структурированные Outputs

Не поддерживается

Инструменты

поддерживается

Завершение погашения

поддерживается

Chat Префикс Заполнение

Не поддерживается

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

DeepSeek

chat

DeepSeek-V3.2

Выпуск: 4 дек. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

0.42

/ M Tokens

DeepSeek

chat

DeepSeek-V3.2-Exp

Выпуск: 10 окт. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

0.41

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1-Terminus

Выпуск: 29 сент. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1

Выпуск: 25 авг. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-V3

Выпуск: 26 дек. 2024 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.25

/ M Tokens

Output:

$

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-R1

Выпуск: 28 мая 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.5

/ M Tokens

Output:

$

2.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-32B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

131K

Максимальный Output:

131K

Input:

$

0.18

/ M Tokens

Output:

$

0.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-14B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

131K

Максимальный Output:

131K

Input:

$

0.1

/ M Tokens

Output:

$

0.1

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-7B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

33K

Максимальный Output:

16K

Input:

$

0.05

/ M Tokens

Output:

$

0.05

/ M Tokens

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Russian (Russia)
Russian (Russia)
Russian (Russia)