Qwen3-30B-A3B-Instruct-2507
О Qwen3-30B-A3B-Instruct-2507
Qwen3-30B-A3B-Instruct-2507 — это обновленная версия Qwen3-30B-A3B в режиме без мышления. Это модель (Model) Соединения Экспертов (MoE) с общим количеством параметров 30,5 миллиардов и 3,3 миллиардами активированных параметров. Эта версия обладает ключевыми улучшениями, включая значительные улучшения в общих способностях, таких как следование инструкциям, логическое рассуждение, понимание текста, математика, наука, программирование и использование инструментов. Она также демонстрирует существенные достижения в покрытии долгосрочных знаний на разных языках и предлагает заметно лучшее соответствие с пользовательскими предпочтениями в субъективных и открытых заданиях, что позволяет предоставлять более полезные ответы и создавать высококачественный текст. Более того, её возможности в понимании контекста на дальние расстояния были улучшены до 256K. Эта модель поддерживает только режим без мышления и не генерирует блоки `<think></think>` в своем Output.
Доступный Serverless
Запускайте запросы немедленно, платите только за использование
$
0.09
/
$
0.3
За 1 миллион Tokens (Input/Output)
Метаданные
Спецификация
Государство
Available
Архитектура
Калибровка
Нет
Смешение экспертов
Да
Общее количество параметров
30B
Активированные параметры
3.3B
Мышление
Нет
Точность
ФП8
Контекст length
262K
Максимум Tokens
262K
поддерживается функциональность
Безсерверный
поддерживается
Безсерверный LoRA
Не поддерживается
Тонкая настройка
Не поддерживается
Embeddings
Не поддерживается
Rerankers
Не поддерживается
Поддержка Image Input
Не поддерживается
Режим JSON
поддерживается
Структурированные Outputs
Не поддерживается
Инструменты
поддерживается
Завершение погашения
Не поддерживается
Chat Префикс Заполнение
Не поддерживается
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.

Qwen
chat
Qwen3-VL-32B-Instruct
Выпуск: 21 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
Выпуск: 21 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
Выпуск: 15 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
Выпуск: 15 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
Выпуск: 4 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
Выпуск: 4 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
Выпуск: 5 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
Выпуск: 11 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
Выпуск: 13 авг. 2025 г.
$
0.29
/ Video
