Модели

Продукты

Цены

Документация

Блог

О

Контакт

🎉 LongCat-2.0 доступно на SiliconFlow. Попробуйте это СЕЙЧАС.

🎉 LongCat-2.0 доступно на SiliconFlow. Попробуйте это СЕЙЧАС.

Модели

Qwen2.5-72B-Instruct-128K

Qwen2.5-72B-Instruct-128K

Справочник API

О Qwen2.5-72B-Instruct-128K

Qwen2.5-72B-Instruct является одной из последних серий крупных языковых моделей, выпущенных Alibaba Cloud. Эта модель 72B демонстрирует значительные улучшения в таких областях, как программирование и математика. Она поддерживает длину контекста до 128K tokens. Модель также предлагает многоязычную поддержку, охватывая более 29 языков, включая китайский, английский и другие. Она показала заметные улучшения в следовании инструкциям, понимании структурированных данных и создании структурированных Outputs, особенно в формате JSON.

Случай использования

Узнайте, как обширный контекст, продвинутый кодинг и возможности структурированного Output модели Qwen2.5-72B-Instruct-128K решают сложные, реальные задачи.

Продвинутая генерация кода

Создание готового к производству кода, рефакторинг устаревших систем и реализация сложных алгоритмов на различных языках с глубоким контекстным пониманием.

Пример сценария использования:

"Разработан полный микросервис на Go, включая конечные точки API, взаимодействие с базой данных и модульные тесты, путем анализа существующей системной архитектуры и требований из спецификации на 50 страницах."

Глубокий анализ документов

Обработка и извлечение инсайтов из обширных юридических контрактов, исследовательских работ или технических руководств с генерацией структурированных резюме и ответов на сложные запросы.

Пример сценария использования:

"Суммировано юридическое заключение на 100 страниц до ключевых аргументов и потенциальных обязательств, представленных в виде JSON-объекта, позволяющего быструю проверку юридическими группами."

Многоязычная обработка данных

Перевод, локализация и обработка структурированных данных на более чем 29 языках, обеспечивая точное сохранение контекста и согласованные Output форматы как JSON.

Пример сценария использования:

"Переведен каталог продукции с английского на японский и немецкий языки, с автоматическим преобразованием спецификаций продукта в локализованный JSON-формат для платформ электронной коммерции."

Продвинутое математическое мышление

Решение сложных математических задач, генерация доказательств и вывод формул с предоставлением пошаговых объяснений для научных и инженерных задач.

Пример сценария использования:

"Выведен новый алгоритм оптимизации для сети цепочки поставок, включая математическую формулировку и реализацию на Python, на основе подробного описания задачи."

Структурированная API и конфигурация Генерация

Автоматическая генерация спецификаций API (например, OpenAPI), системные конфигурации или схемы данных в точных JSON/YAML форматах из требований на естественном языке.

Пример сценария использования:

"Создана полная спецификация OpenAPI 3.0 для нового REST API, включая аутентификацию, конечные точки и модели данных, на основе высокоуровневого проектного документа и примеров запросов."

Метаданные

Создать на

18 сент. 2024 г.

Лицензия

APACHE 2.0

Поставщик

Qwen

HuggingFace

Qwen2.5-72B-Instruct-128K

Спецификация

Государство

Deprecated

Архитектура

Transformer Decoder

Калибровка

Нет

Смешение экспертов

Нет

Общее количество параметров

72B

Активированные параметры

72B

Мышление

Нет

Точность

ФП8

Контекст length

131K

Максимум Tokens

4K

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

Qwen

chat

Qwen3-VL-32B-Instruct

Выпуск: 21 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

Выпуск: 21 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

Выпуск: 15 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

Выпуск: 15 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

Выпуск: 4 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

Выпуск: 4 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

Выпуск: 5 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

Выпуск: 11 окт. 2025 г.

Общий Контекст:

262K

Максимальный Output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

Выпуск: 13 авг. 2025 г.

$

0.29

/ Video

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность

СТРАНИЦЫ

Продукты

Документация

МОДЕЛИ

ПРОДУКТЫ

Зарезервированные GPU

© 2025 SiliconFlow

·

Конфиденциальность