Qwen3-235B-A22B-Instruct-2507
О Qwen3-235B-A22B-Instruct-2507
Qwen3-235B-A22B-Instruct-2507 — флагманская модель на основе смеси экспертов (Mixture-of-Experts, MoE) из серии Qwen3, разработанная командой Qwen от Alibaba Cloud. Эта Model обладает общим количеством 235 миллиардов параметров, из которых 22 миллиарда активируются при каждом проходе вперед. Она была выпущена как обновленная версия режима без мышления Qwen3-235B-A22B, с значительными улучшениями в общих возможностях, таких как следование инструкциям, логическое рассуждение, понимание Text, математика, наука, кодирование и использование инструментов. Кроме того, Model обеспечивает значительное улучшение в покрытии знания длинного хвоста на нескольких языках и демонстрирует заметно лучшее согласование с предпочтениями пользователей в субъективных и открытых задачах, что позволяет генерировать более полезные ответы и Text более высокого качества. В частности, она нативно поддерживает обширное окно контекста размером 256K (262 144 tokens), что повышает её возможности для понимания длинных контекстов. Эта версия исключительно поддерживает режим без мышления и не генерирует блоки <think>, стремясь предоставить более эффективные и точные ответы для задач, таких как прямые вопросы и ответы, и извлечение знаний.
Доступный Serverless
Запускайте запросы немедленно, платите только за использование
$
0.09
/
$
0.6
За 1 миллион Tokens (Input/Output)
Метаданные
Спецификация
Государство
Available
Архитектура
Калибровка
Да
Смешение экспертов
Да
Общее количество параметров
235B
Активированные параметры
22B
Мышление
Нет
Точность
ФП8
Контекст length
262K
Максимум Tokens
262K
поддерживается функциональность
Безсерверный
поддерживается
Безсерверный LoRA
Не поддерживается
Тонкая настройка
Не поддерживается
Embeddings
Не поддерживается
Rerankers
Не поддерживается
Поддержка Image Input
Не поддерживается
Режим JSON
поддерживается
Структурированные Outputs
Не поддерживается
Инструменты
поддерживается
Завершение погашения
Не поддерживается
Chat Префикс Заполнение
поддерживается
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.

Qwen
chat
Qwen3-VL-32B-Instruct
Выпуск: 21 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
Выпуск: 21 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
Выпуск: 15 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
Выпуск: 15 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
Выпуск: 4 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
Выпуск: 4 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
Выпуск: 5 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
Выпуск: 11 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
Выпуск: 13 авг. 2025 г.
$
0.29
/ Video
