Qwen3-Next-80B-A3B-Thinking
О Qwen3-Next-80B-A3B-Thinking
Qwen3-Next-80B-A3B-Thinking — это модель следующего поколения от команды Qwen компании Alibaba, специально разработанная для сложных задач рассуждения. Она построена на инновационной архитектуре Qwen3-Next, которая сочетает в себе механизм гибридного внимания (Gated DeltaNet и Gated Attention) с высокоразряженной структурой смеси экспертов (MoE) для достижения максимальной эффективности обучения и inference. Как разреженная модель с 80 миллиардами параметров, она активирует только около 3 миллиардов параметров в ходе inference, что значительно снижает вычислительные затраты и обеспечивает более чем в 10 раз более высокую пропускную способность по сравнению с моделью Qwen3-32B на задачах с длинным контекстом, превышающим 32K tokenов. Эта версия 'Thinking' оптимизирована для сложных многоэтапных задач, таких как математические доказательства, синтез кода, логический анализ и планирование агентов, и по умолчанию она outputирует структурированные следы 'мышления'. По производительности она превосходит более дорогие модели, такие как Qwen3-32B-Thinking, и превзошла Gemini-2.5-Flash-Thinking на нескольких бенчмарках.
Доступный Serverless
Запускайте запросы немедленно, платите только за использование
$
0.14
/
$
0.57
За 1 миллион Tokens (Input/Output)
Метаданные
Спецификация
Государство
Available
Архитектура
Калибровка
Нет
Смешение экспертов
Да
Общее количество параметров
80B
Активированные параметры
3B
Мышление
Нет
Точность
ФП8
Контекст length
262K
Максимум Tokens
262K
поддерживается функциональность
Безсерверный
поддерживается
Безсерверный LoRA
Не поддерживается
Тонкая настройка
Не поддерживается
Embeddings
Не поддерживается
Rerankers
Не поддерживается
Поддержка Image Input
Не поддерживается
Режим JSON
Не поддерживается
Структурированные Outputs
Не поддерживается
Инструменты
поддерживается
Завершение погашения
Не поддерживается
Chat Префикс Заполнение
поддерживается
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.

Qwen
chat
Qwen3-VL-32B-Instruct
Выпуск: 21 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
Выпуск: 21 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
Выпуск: 15 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
Выпуск: 15 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
Выпуск: 4 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
Выпуск: 4 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
Выпуск: 5 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
Выпуск: 11 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
Выпуск: 13 авг. 2025 г.
$
0.29
/ Video
