Qwen2.5-72B-Instruct

Qwen2.5-72B-Instruct

Qwen/Qwen2.5-72B-Instruct

О Qwen2.5-72B-Instruct

Qwen2.5-72B-Instruct является одной из последних серий больших языковых моделей, выпущенных Alibaba Cloud. Модель 72B демонстрирует значительные улучшения в таких областях, как программирование и математика. Модель также предлагает многоязычную поддержку, охватывая более 29 языков, включая китайский и английский. Она показывает заметные улучшения в следовании инструкциям, понимании структурированных данных и генерации структурированных Output, в частности, в формате JSON.

Доступный Serverless

Запускайте запросы немедленно, платите только за использование

За 1 миллион Tokens (Input/Output)

$

0.59

/ M Tokens

За 1 миллион Tokens (Input/Output)

$

0.59

/ M Tokens

Метаданные

Создать на

Лицензия

-

Поставщик

Qwen

Спецификация

Государство

Available

Архитектура

Causal Transformer

Калибровка

Нет

Смешение экспертов

Да

Общее количество параметров

72B

Активированные параметры

72.7B

Мышление

Нет

Точность

ФП8

Контекст length

33K

Максимум Tokens

4K

поддерживается функциональность

Безсерверный

поддерживается

Безсерверный LoRA

Не поддерживается

Тонкая настройка

Не поддерживается

Embeddings

Не поддерживается

Rerankers

Не поддерживается

Поддержка Image Input

Не поддерживается

Режим JSON

поддерживается

Структурированные Outputs

Не поддерживается

Инструменты

поддерживается

Завершение погашения

Не поддерживается

Chat Префикс Заполнение

поддерживается

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

Qwen

chat

Qwen3.6-35B-A3B

Выпуск: 17 апр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.6

/ M Tokens

Qwen

chat

Qwen3.6-27B

Выпуск: 23 апр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

3.2

/ M Tokens

Qwen

chat

Qwen3.5-397B-A17B

Выпуск: 24 апр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.39

/ M Tokens

Output:

$

2.34

/ M Tokens

Qwen

chat

Qwen3.5-122B-A10B

Выпуск: 24 апр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.26

/ M Tokens

Output:

$

2.08

/ M Tokens

Qwen

chat

Qwen3.5-35B-A3B

Выпуск: 25 февр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.24

/ M Tokens

Output:

$

1.8

/ M Tokens

Qwen

chat

Qwen3.5-27B

Выпуск: 24 апр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.25

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3.5-9B

Выпуск: 24 апр. 2026 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.1

/ M Tokens

Output:

$

0.15

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Instruct

Выпуск: 21 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

Выпуск: 21 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?