
Qwen
Text Generation
Qwen3-VL-32B-Instruct
Выпуск: 21 окт. 2025 г.
Qwen3-VL — это Vision-языковая Model в серии Qwen3, достигающая первоклассных (SOTA) результатов на различных Vision-языковых (VL) тестах. Model поддерживает высокоразрешенный Image Input до уровня мегапикселей и обладает сильными возможностями в общем визуальном понимании, многоязычном OCR, детализированном визуальном привязывании и визуальном диалоге. Являясь частью серии Qwen3, он наследует мощную языковую основу, что позволяет ему понимать и выполнять сложные инструкции....
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
Text Generation
Qwen3-VL-32B-Thinking
Выпуск: 21 окт. 2025 г.
Qwen3-VL-Thinking — это версия серии Qwen3-VL, специально оптимизированная для сложных задач визуального мышления. Она включает в себя «Режим мышления», позволяющий генерировать детализированные промежуточные шаги рассуждения (цепочка рассуждений) перед предоставлением окончательного ответа. Этот дизайн значительно улучшает производительность этого model на задачах визуальных вопросов и ответов (VQA) и других задачах vision-языка, которые требуют многослойной логики, планирования и глубокого анализа....
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
Text Generation
Qwen3-VL-8B-Instruct
Выпуск: 15 окт. 2025 г.
Qwen3-VL-8B-Instruct — это Vision-language Model серии Qwen3, демонстрирующая сильные возможности в общем визуальном понимании, визуально-центрированном диалоге и многоязычном Text-распознавании в Image....
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
Text Generation
Qwen3-VL-8B-Thinking
Выпуск: 15 окт. 2025 г.
Qwen3-VL-8B-Thinking является vision-языковой Model из серии Qwen3, оптимизированной для сценариев, требующих сложного рассуждения. В этом режиме Thinking, Model выполняет пошаговое мышление и рассуждение перед предоставлением окончательного ответа....
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
Text Generation
Qwen3-VL-235B-A22B-Instruct
Выпуск: 4 окт. 2025 г.
Qwen3-VL-235B-A22B-Instruct — это модель типа Mixture-of-Experts (MoE) с 235 миллиардами параметров для Vision-Language (язык зрения), с 22 миллиардами активированных параметров. Это версия Qwen3-VL-235B-A22B, настроенная на выполнение инструкций, и она адаптирована для Chat-приложений....
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
Text Generation
Qwen3-VL-235B-A22B-Thinking
Выпуск: 4 окт. 2025 г.
Qwen3-VL-235B-A22B-Thinking является одной из моделей серии Qwen3-VL, улучшенной версии Thinking, которая достигает передовых результатов в области мультимодального рассуждения, особенно в областях STEM, математики, причинного анализа и логических, основанных на доказательствах ответах. Она обладает архитектурой Mixture-of-Experts (MoE) с 235 миллиардом общих параметров и 22 миллиардом активных параметров....
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
Text Generation
Qwen3-VL-30B-A3B-Instruct
Выпуск: 5 окт. 2025 г.
Серия Qwen3-VL обеспечивает превосходное понимание и генерацию Text, более глубокое визуальное восприятие и рассуждение, увеличенную длину контекста, улучшенное пространственное и Video динамическое понимание, а также более сильные возможности взаимодействия агентов. Доступен в плотных и MoE архитектурах, которые масштабируются от края до облака, с изданиями Instruct и улучшенными для рассуждений Thinking....
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
Text Generation
Qwen3-VL-30B-A3B-Thinking
Выпуск: 11 окт. 2025 г.
Серия Qwen3-VL обеспечивает превосходное понимание и генерацию Text, более глубокое визуальное восприятие и рассуждение, увеличенную длину контекста, улучшенное пространственное и Video динамическое понимание, а также более сильные возможности взаимодействия агентов. Доступен в плотных и MoE архитектурах, которые масштабируются от края до облака, с изданиями Instruct и улучшенными для рассуждений Thinking....
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
Image-to-Video
Wan2.2-I2V-A14B
Выпуск: 13 авг. 2025 г.
$
0.29
/ Video


Qwen
Text-to-Video
Wan2.2-T2V-A14B
Выпуск: 13 авг. 2025 г.
$
0.29
/ Video


Qwen
Text Generation
Qwen3-Next-80B-A3B-Instruct
Выпуск: 18 сент. 2025 г.
Qwen3-Next-80B-A3B-Instruct — это модель следующего поколения, выпущенная командой Qwen компании Alibaba. Она построена на новой архитектуре Qwen3-Next, предназначенной для максимальной эффективности обучения и Inference. Модель включает инновационные функции, такие как механизм гибридного внимания (Gated DeltaNet и Gated Attention), высокоразреженная структура с механизмом смеси экспертов (MoE) и различные оптимизации стабильности. Как разреженная модель с 80 миллиардами параметров, она активирует только около 3 миллиардов параметров на token во время Inference, что значительно снижает вычислительные затраты и обеспечивает более чем в 10 раз большую производительность по сравнению с моделью Qwen3-32B для задач с длинным контекстом, превышающих 32K tokens. Это версия с настройкой инструкций, оптимизированная для задач общего назначения, и не поддерживает режим 'мышления'. Что касается производительности, она сопоставима с флагманской моделью Qwen, Qwen3-235B, по некоторым критериям, демонстрируя значительные преимущества в сценах с ультрадлинным контекстом....
Total Context:
262K
Max output:
262K
Input:
$
0.14
/ M Tokens
Output:
$
1.4
/ M Tokens

Qwen
Text Generation
Qwen3-Next-80B-A3B-Thinking
Выпуск: 25 сент. 2025 г.
Qwen3-Next-80B-A3B-Thinking — это модель следующего поколения от команды Qwen компании Alibaba, специально разработанная для сложных задач рассуждения. Она построена на инновационной архитектуре Qwen3-Next, которая сочетает в себе механизм гибридного внимания (Gated DeltaNet и Gated Attention) с высокоразряженной структурой смеси экспертов (MoE) для достижения максимальной эффективности обучения и inference. Как разреженная модель с 80 миллиардами параметров, она активирует только около 3 миллиардов параметров в ходе inference, что значительно снижает вычислительные затраты и обеспечивает более чем в 10 раз более высокую пропускную способность по сравнению с моделью Qwen3-32B на задачах с длинным контекстом, превышающим 32K tokenов. Эта версия 'Thinking' оптимизирована для сложных многоэтапных задач, таких как математические доказательства, синтез кода, логический анализ и планирование агентов, и по умолчанию она outputирует структурированные следы 'мышления'. По производительности она превосходит более дорогие модели, такие как Qwen3-32B-Thinking, и превзошла Gemini-2.5-Flash-Thinking на нескольких бенчмарках....
Total Context:
262K
Max output:
262K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

Qwen
Text Generation
Qwen3-Omni-30B-A3B-Captioner
Выпуск: 4 окт. 2025 г.
Qwen3-Omni-30B-A3B-Captioner — это Vision-Language Model (VLM) от команды Qwen компании Alibaba, являющаяся частью серии Qwen3. Она специально разработана для генерации высококачественных, подробных и точных Image подписей. Основанная на архитектуре Mixture of Experts (MoE) с общим параметром в 30B, модель может глубоко понимать содержимое Image и переводить его в богатый, естественный Text....
Total Context:
66K
Max output:
66K
Input:
$
0.1
/ M Tokens
Output:
$
0.4
/ M Tokens

Qwen
Text Generation
Qwen3-Omni-30B-A3B-Instruct
Выпуск: 4 окт. 2025 г.
Qwen3-Omni-30B-A3B-Instruct является частью последней серии Qwen3 от команды Qwen компании Alibaba. Это модель (MoE) с мешаниной экспертов с общим числом параметров в 30 миллиардов и активными параметрами в 3 миллиарда, что эффективно снижает затраты на Inference, сохраняя мощную производительность. Модель была обучена на высококачественных, мультиисточниковых и многоязычных данных, демонстрируя отличный результат в базовых возможностях, таких как многоязычный диалог, а также в коде и математике....
Total Context:
66K
Max output:
66K
Input:
$
0.1
/ M Tokens
Output:
$
0.4
/ M Tokens

Qwen
Text Generation
Qwen3-Omni-30B-A3B-Thinking
Выпуск: 4 окт. 2025 г.
Qwen3-Omni-30B-A3B-Thinking является ядром компонента "Thinker" в архитектуре "Thinker-Talker" омни-модальной модели Qwen3-Omni. Он специально разработан для обработки мультимодальных входных данных, включая Text, Audio, Image и Video, и выполнения сложных цепочек мыслительных рассуждений. Будучи разумом системы, эта Model объединяет все Inputs в общее представительное пространство для понимания и анализа, но его Output – только Text. Этот дизайн позволяет ему превосходно решать сложные задачи, требующие глубокого раздумья и межмодального понимания, такие как математические задачи, представленные в изображениях, что делает его ключевым для мощных когнитивных способностей всей архитектуры Qwen3-Omni....
Total Context:
66K
Max output:
66K
Input:
$
0.1
/ M Tokens
Output:
$
0.4
/ M Tokens

Qwen
Text-to-Image
Qwen-Image
Выпуск: 15 сент. 2025 г.
$
0.02
/ Image


Qwen
Image-to-Image
Qwen-Image-Edit
Выпуск: 18 сент. 2025 г.
$
0.04
/ Image


Qwen
Text Generation
Qwen3-Coder-480B-A35B-Instruct
Выпуск: 31 июл. 2025 г.
Qwen3-Coder-480B-A35B-Instruct является самым агентным кодовым Model'ом, выпущенным Alibaba на сегодняшний день. Это модель Mixture-of-Experts (MoE) с общим количеством параметров в 480 миллиардов и 35 миллиардов активированных параметров, достигая баланса между эффективностью и производительностью. Model поддерживает длину контекста в 256K (примерно 262,144) token'ов, которую можно продлить до 1 миллиона token'ов с использованием экстраполяционных методов, таких как YaRN, что позволяет обрабатывать коды репозитарного масштаба и сложные программные задачи. Qwen3-Coder специально разработан для агентных рабочих процессов кодирования, где он не только генерирует код, но и автономно взаимодействует с инструментами разработчика и средами для решения сложных задач. Он достиг передовых результатов среди открытых моделей на различных агентных бенчмарках кодирования, с производительностью, сопоставимой с ведущими Model'ами, такими как Claude Sonnet 4. Наряду с Model'ом, Alibaba также открыла исходный код Qwen Code, инструмент командной строки, разработанный для полного раскрытия мощных агентных возможностей кодирования....
Total Context:
262K
Max output:
262K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
Text Generation
Qwen3-Coder-30B-A3B-Instruct
Выпуск: 1 авг. 2025 г.
Qwen3-Coder-30B-A3B-Instruct — это кодовый Model из серии Qwen3, разработанный командой Qwen компании Alibaba. Как упрощенный и оптимизированный Model, он поддерживает впечатляющую производительность и эффективность, сосредотачиваясь на усовершенствованных возможностях кодирования. Он демонстрирует значительное преимущество в производительности среди open-source Models на сложных задачах, таких как агентское кодирование, использование агентского браузера и другие основные задачи кодирования. Model изначально поддерживает долгий контекст из 256K Tokens, который может быть расширен до 1M Tokens, что позволяет лучше понимать и обрабатывать репозитории. Более того, он обеспечивает надежную поддержку агентского кодирования для платформ, таких как Qwen Code и CLINE, с специально разработанным форматом вызова функций....
Total Context:
262K
Max output:
262K
Input:
$
0.07
/ M Tokens
Output:
$
0.28
/ M Tokens

Qwen
Text Generation
Qwen3-30B-A3B-Instruct-2507
Выпуск: 30 июл. 2025 г.
Qwen3-30B-A3B-Instruct-2507 — это обновленная версия Qwen3-30B-A3B в режиме без мышления. Это модель (Model) Соединения Экспертов (MoE) с общим количеством параметров 30,5 миллиардов и 3,3 миллиардами активированных параметров. Эта версия обладает ключевыми улучшениями, включая значительные улучшения в общих способностях, таких как следование инструкциям, логическое рассуждение, понимание текста, математика, наука, программирование и использование инструментов. Она также демонстрирует существенные достижения в покрытии долгосрочных знаний на разных языках и предлагает заметно лучшее соответствие с пользовательскими предпочтениями в субъективных и открытых заданиях, что позволяет предоставлять более полезные ответы и создавать высококачественный текст. Более того, её возможности в понимании контекста на дальние расстояния были улучшены до 256K. Эта модель поддерживает только режим без мышления и не генерирует блоки `<think></think>` в своем Output....
Total Context:
262K
Max output:
262K
Input:
$
0.09
/ M Tokens
Output:
$
0.3
/ M Tokens

Qwen
Text Generation
Qwen3-30B-A3B-Thinking-2507
Выпуск: 31 июл. 2025 г.
Qwen3-30B-A3B-Thinking-2507 — это последняя мыслительная Model в серии Qwen3, выпущенная командой Qwen компании Alibaba. Как модель Смешения экспертов (MoE) с общим числом параметров 30,5 миллиардов и активными параметрами 3,3 миллиарда, она сосредоточена на улучшении возможностей для выполнения сложных задач. Model демонстрирует значительно улучшенную производительность в решении задач, требующих рассуждений, включая логические рассуждения, математику, науку, программирование и академические эталоны, которые обычно требуют человеческой экспертизы. Она также показывает заметно более хорошие общие способности, такие как следование инструкциям, использование инструментов, генерация Text и выравнивание с человеческими предпочтениями. Model изначально поддерживает возможность понимания в длинном контексте длиной до 256 тысяч и может быть расширена до 1 миллиона tokens. Эта версия специально разработана для 'режима мышления' для решения очень сложных проблем через пошаговое рассуждение и также выделяется в агентных способностях....
Total Context:
262K
Max output:
131K
Input:
$
0.09
/ M Tokens
Output:
$
0.3
/ M Tokens

Qwen
Text Generation
Qwen3-235B-A22B-Instruct-2507
Выпуск: 23 июл. 2025 г.
Qwen3-235B-A22B-Instruct-2507 — флагманская модель на основе смеси экспертов (Mixture-of-Experts, MoE) из серии Qwen3, разработанная командой Qwen от Alibaba Cloud. Эта Model обладает общим количеством 235 миллиардов параметров, из которых 22 миллиарда активируются при каждом проходе вперед. Она была выпущена как обновленная версия режима без мышления Qwen3-235B-A22B, с значительными улучшениями в общих возможностях, таких как следование инструкциям, логическое рассуждение, понимание Text, математика, наука, кодирование и использование инструментов. Кроме того, Model обеспечивает значительное улучшение в покрытии знания длинного хвоста на нескольких языках и демонстрирует заметно лучшее согласование с предпочтениями пользователей в субъективных и открытых задачах, что позволяет генерировать более полезные ответы и Text более высокого качества. В частности, она нативно поддерживает обширное окно контекста размером 256K (262 144 tokens), что повышает её возможности для понимания длинных контекстов. Эта версия исключительно поддерживает режим без мышления и не генерирует блоки <think>, стремясь предоставить более эффективные и точные ответы для задач, таких как прямые вопросы и ответы, и извлечение знаний....
Total Context:
262K
Max output:
262K
Input:
$
0.09
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
Text Generation
Qwen3-235B-A22B-Thinking-2507
Выпуск: 28 июл. 2025 г.
Qwen3-235B-A22B-Thinking-2507 является членом серии больших языковых Model Qwen3, разработанной командой Qwen компании Alibaba, специализирующейся на задачах сложного рассуждения. Model построена на архитектуре Mixture-of-Experts (MoE), с общим количеством параметров в 235 миллиардов и примерно 22 миллиардов активированных параметров на token, что повышает вычислительную эффективность при сохранении мощной производительности. Как специализированная 'мыслящая' Model, она демонстрирует значительно улучшенные результаты в выполнении задач, требующих человеческой экспертности, таких как логическое рассуждение, математика, наука, кодирование и академические контрольные показатели, достигая наивысших результатов среди моделей с открытым исходным кодом для мышления. Кроме того, Model имеет расширенные общие возможности, такие как следование инструкциям, использование инструментов и генерация Text, и нативно поддерживает способность восприятия в длинном контексте 256K, что делает её идеальной для сценариев, требующих глубоких размышлений и обработки длинных документов....
Total Context:
262K
Max output:
262K
Input:
$
0.13
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
Text Generation
Qwen3-32B
Выпуск: 30 апр. 2025 г.
Qwen3-32B — это последняя большая языковая модель в серии Qwen с 32.8 миллиардами параметров. Эта модель уникально поддерживает плавное переключение между режимом мышления (для сложного логического рассуждения, математики и программирования) и режимом немышления (для эффективного, универсального диалога). Она демонстрирует значительно улучшенные способности к рассуждению, превосходя предыдущие instruct модели QwQ и Qwen2.5 в математике, генерации кода и логическом рассуждении на уровне здравого смысла. Модель превосходит в выравнивании человеческих предпочтений для творческого письма, ролевых игр и диалогов с множественными ходами. Кроме того, она поддерживает более 100 языков и диалектов с сильными возможностями следования многоязычным инструкциям и перевода....
Total Context:
131K
Max output:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

Qwen
Text Generation
Qwen3-14B
Выпуск: 30 апр. 2025 г.
Qwen3-14B — это последняя большая языковая Model в серии Qwen с 14.8 миллиардами параметров. Эта Model уникально поддерживает бесшовное переключение между режимом мышления (для сложного логического мышления, математики и программирования) и режимом немышления (для эффективного, универсального диалога). Она демонстрирует значительно улучшенные способности к рассуждению, превосходя предыдущие instruct-модели QwQ и Qwen2.5 в математике, генерации кода и логическом рассуждении на уровне здравого смысла. Model превосходит в согласовании предпочтений человека для креативного письма, ролевых игр и многоходовых диалогов. Кроме того, она поддерживает более 100 языков и диалектов с сильными возможностями мульти-языковых инструкций и переводов....
Total Context:
131K
Max output:
131K
Input:
$
0.07
/ M Tokens
Output:
$
0.28
/ M Tokens

Qwen
Text Generation
Qwen3-8B
Выпуск: 30 апр. 2025 г.
Qwen3-8B — это последняя крупная языковая модель в серии Qwen с параметрами 8.2B. Эта модель уникально поддерживает бесперебойное переключение между режимом мышления (для сложного логического рассуждения, математики и программирования) и режимом немысли (для эффективного, общего диалога). Она демонстрирует значительно улучшенные способности к рассуждению, превосходя предыдущие модели QwQ и Qwen2.5 в обучении математике, генерации кода и логическом рассуждении здравого смысла. Модель преуспевает в соотношении человеческих предпочтений для креативного письма, ролевых игр и многошаговых диалогов. Кроме того, она поддерживает более 100 языков и диалектов с сильными мультиязычными инструкциями и возможностями перевода....
Total Context:
131K
Max output:
131K
Input:
$
0.06
/ M Tokens
Output:
$
0.06
/ M Tokens

Qwen
Reranker
Qwen3-Reranker-8B
Выпуск: 6 июн. 2025 г.
Qwen3-Reranker-8B — это модель повторного ранжирования текста с 8 миллиардами параметров из серии Qwen3. Она разработана для улучшения и повышения качества результатов поиска путем точного переупорядочивания документов на основе их релевантности запросу. Построенная на мощных фундаментальных моделях Qwen3, она отлично понимает длинный текст с контекстной длиной в 32k и поддерживает более 100 языков. Модель Qwen3-Reranker-8B является частью гибкой серии, которая предлагает передовые возможности в различных сценариях поиска текста и кода....
$
0.04
/ M Tokens

Qwen
Embedding
Qwen3-Embedding-8B
Выпуск: 6 июн. 2025 г.
Qwen3-Embedding-8B — это последняя проприетарная Model в серии Qwen3 Embedding, специально разработанная для задач встраивания и ранжирования Text. Построенная на основе плотных фундаментальных моделей серии Qwen3, эта модель с 8 миллиардами параметров поддерживает длину контекста до 32K и может генерировать встраивания с размерами до 4096. Model наследует исключительные мультиязыковые возможности, поддерживающие более 100 языков, а также навыки понимания и рассуждения с длинными Text. Она занимает первое место в многоязычном рейтинге MTEB (по состоянию на 5 июня 2025 года, оценка 70.58) и демонстрирует передовые показатели в различных задачах, включая извлечение Text, извлечение кода, классификацию Text, кластеризацию и битекстовый майнинг. Model предлагает гибкие размеры векторов (от 32 до 4096) и возможности, учитывающие инструкции, для улучшения производительности в определённых задачах и сценариях....
Input:
$
0.04
/ M Tokens

Qwen
Reranker
Qwen3-Reranker-4B
Выпуск: 6 июн. 2025 г.
Qwen3-Reranker-4B — это мощная модель повторной оценки Text из серии Qwen3, содержащая 4 миллиарда параметров. Она разработана для значительного повышения релевантности результатов поиска путем переупорядочивания начального списка документов на основе запроса. Эта Model наследует основные преимущества своей основы Qwen3, включая исключительное понимание длинного Text (до 32k контекста) и надежные возможности в более чем 100 языках. Согласно бенчмаркам, Model Qwen3-Reranker-4B демонстрирует превосходную производительность в различных оценках извлечения Text и кода....
$
0.02
/ M Tokens

Qwen
Embedding
Qwen3-Embedding-4B
Выпуск: 6 июн. 2025 г.
Qwen3-Embedding-4B является последней проприетарной моделью в серии Qwen3 Embedding, специально разработанной для задач эмбеддинга текстов и ранжирования. Построенная на основе плотных основополагающих моделей серии Qwen3, эта модель с 4 миллиардами параметров поддерживает длины контекста до 32 тысяч и может генерировать эмбединги с размерностями до 2560. Модель наследует исключительные возможности мультиязычной поддержки, охватывающие более 100 языков, а также навыки понимания и анализа длинных текстов. Она достигает отличных результатов на многоязычном рейтинге MTEB (оценка 69.45) и демонстрирует выдающиеся результаты в различных задачах, включая поиск текста, поиск кода, классификацию текстов, кластеризацию и добычу двуязычных текстов. Модель предлагает гибкие размерности векторов (от 32 до 2560) и возможности с учетом инструкций для улучшенной производительности в конкретных задачах и сценариях, обеспечивая оптимальный баланс между эффективностью и эффективностью....
Input:
$
0.02
/ M Tokens

Qwen
Reranker
Qwen3-Reranker-0.6B
Выпуск: 6 июн. 2025 г.
Qwen3-Reranker-0.6B — это Text модель упорядочивания из серии Qwen3. Она специально предназначена для уточнения результатов начальных систем поиска, переставляя документы на основе их релевантности данному запросу. Имея 0.6 миллиардов параметров и длину контекста 32k, эта Model использует сильные многолингвальные (поддерживающие более 100 языков), способности к пониманию длинных текстов и умозаключение своей Qwen3 платформы. Результаты оценки показывают, что Qwen3-Reranker-0.6B достигает высокого уровня производительности по различным критериям поиска текстов, включая MTEB-R, CMTEB-R и MLDR....
$
0.01
/ M Tokens

Qwen
Embedding
Qwen3-Embedding-0.6B
Выпуск: 6 июн. 2025 г.
Qwen3-Embedding-0.6B является последней проприетарной моделью в серии Qwen3 Embedding, специально разработанной для задач текстового встраивания и ранжирования. Построенная на основе плотных фундаментальных моделей серии Qwen3, эта модель с 0.6B параметрами поддерживает длины контекста до 32K и может генерировать встраивания с размерами до 1024. Модель наследует исключительные мультиязычные возможности, поддерживающие более 100 языков, а также навыки понимания длинного текста и рассуждения. Она достигает высокой производительности на многоязычной лидерборде MTEB (оценка 64.33) и демонстрирует отличные результаты в различных задачах, включая извлечение текста, извлечение кода, классификацию текста, кластеризацию и майнинг двуязычных текстов. Модель предлагает гибкие размеры векторов (от 32 до 1024) и возможности, осведомленные об инструкциях, для улучшенной производительности в конкретных задачах и сценариях, делая её идеальным выбором для приложений, приоритетизирующих как эффективность, так и результативность....
Input:
$
0.01
/ M Tokens

Qwen
Text Generation
Qwen2.5-VL-32B-Instruct
Выпуск: 24 мар. 2025 г.
Qwen2.5-VL-32B-Instruct — это мультимодальная большая языковая модель, выпущенная командой Qwen, являющаяся частью серии Qwen2.5-VL. Эта Model не только умеет распознавать обычные объекты, но и обладает высокой способностью анализировать тексты, диаграммы, иконки, графику и макеты внутри Image. Она действует как визуальный агент, который может рассуждать и динамично направлять инструменты, способный использовать компьютеры и телефоны. Кроме того, Model может точно локализовать объекты в Image и генерировать структурированные Outputs для данных, таких как счета и таблицы. По сравнению с его предшественником Qwen2-VL, эта версия улучшила математические и задачи решения через обучение с подкреплением, со стилями ответов, настроенными для лучшего соответствия человеческим предпочтениям....
Total Context:
131K
Max output:
131K
Input:
$
0.27
/ M Tokens
Output:
$
0.27
/ M Tokens

Qwen
Text Generation
QwQ-32B
Выпуск: 6 мар. 2025 г.
QwQ — это рассуждающая модель серии Qwen. По сравнению с обычными моделями с настройкой на инструкции, QwQ, способная думать и рассуждать, может добиться значительно улучшенной производительности в последующих задачах, особенно в сложных проблемах. QwQ-32B — это средняя по размеру рассуждающая модель, способная достигать конкурентных показателей в сравнении с передовыми рассуждающими моделями, например, DeepSeek-R1, o1-mini. Модель включает такие технологии, как RoPE, SwiGLU, RMSNorm и Attention QKV bias, с 64 слоями и 40 Q головы внимания (8 для KV в архитектуре GQA)...
Total Context:
131K
Max output:
131K
Input:
$
0.15
/ M Tokens
Output:
$
0.58
/ M Tokens

Qwen
Text Generation
Qwen2.5-VL-72B-Instruct
Выпуск: 28 янв. 2025 г.
Qwen2.5-VL — это Vision-Text Model в серии Qwen2.5, который демонстрирует значительные улучшения во многих аспектах: он обладает сильными возможностями визуального понимания, распознавая общие объекты при анализе Text, диаграмм и макетов в Image; он функционирует как визуальный агент, способный к рассуждениям и динамическому направлению инструментов; он может понимать Video продолжительностью более 1 часа и фиксировать ключевые события; он точно локализует объекты в Image, генерируя ограничивающие рамки или точки; и поддерживает структурированные Outputs для отсканированных данных, таких как счета и формы. Model демонстрирует отличные результаты на различных тестах, включая Image, Video и агентные задачи....
Total Context:
131K
Max output:
4K
Input:
$
0.59
/ M Tokens
Output:
$
0.59
/ M Tokens

Qwen
Text Generation
Qwen2.5-VL-7B-Instruct
Выпуск: 28 янв. 2025 г.
Qwen2.5-VL — это новый член серии Qwen, оснащённый мощными визуальными возможностями понимания. Он может анализировать Text, диаграммы и макеты в Image, понимать длинные Video и фиксировать события. Он способен рассуждать, манипулировать инструментами, поддерживать локализацию объектов с несколькими форматами и генерировать структурированные Output. Модель была оптимизирована для динамического разрешения и обучения на частоте кадров в понимании Video и повысила эффективность визуального энкодера....
Total Context:
33K
Max output:
4K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens

Qwen
Text Generation
Qwen2.5-Coder-32B-Instruct
Выпуск: 11 нояб. 2024 г.
Qwen2.5-Coder-32B-Instruct — это большая языковая модель, специфичная для кода, разработанная на основе Qwen2.5. Модель прошла обучение на 5.5 триллиона токенов, достигая значительных улучшений в генерации кода, логике кода и его исправлении. В настоящее время это самая продвинутая модель открытого исходного кода, с возможностями кодирования, сопоставимыми с GPT-4. Модель не только улучшила способности кодирования, но и сохраняет сильные стороны в математике и общих возможностях, а также поддерживает обработку длинных Text....
Total Context:
33K
Max output:
4K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens

Qwen
Text Generation
Qwen2.5-72B-Instruct-128K
Выпуск: 18 сент. 2024 г.
Qwen2.5-72B-Instruct является одной из последних серий крупных языковых моделей, выпущенных Alibaba Cloud. Эта модель 72B демонстрирует значительные улучшения в таких областях, как программирование и математика. Она поддерживает длину контекста до 128K tokens. Модель также предлагает многоязычную поддержку, охватывая более 29 языков, включая китайский, английский и другие. Она показала заметные улучшения в следовании инструкциям, понимании структурированных данных и создании структурированных Outputs, особенно в формате JSON....
Total Context:
131K
Max output:
4K
Input:
$
0.59
/ M Tokens
Output:
$
0.59
/ M Tokens

Qwen
Text Generation
Qwen2.5-72B-Instruct
Выпуск: 18 сент. 2024 г.
Qwen2.5-72B-Instruct является одной из последних серий больших языковых моделей, выпущенных Alibaba Cloud. Модель 72B демонстрирует значительные улучшения в таких областях, как программирование и математика. Модель также предлагает многоязычную поддержку, охватывая более 29 языков, включая китайский и английский. Она показывает заметные улучшения в следовании инструкциям, понимании структурированных данных и генерации структурированных Output, в частности, в формате JSON....
Total Context:
33K
Max output:
4K
Input:
$
0.59
/ M Tokens
Output:
$
0.59
/ M Tokens

Qwen
Text Generation
Qwen2.5-32B-Instruct
Выпуск: 19 сент. 2024 г.
Qwen2.5-32B-Instruct — это одна из последних серий крупных языковых моделей, выпущенных Alibaba Cloud. Эта модель 32B демонстрирует значительные улучшения в таких областях, как программирование и математика. Модель также предлагает поддержку нескольких языков, охватывающую более 29 языков, включая китайский, английский и другие. Она показывает заметные улучшения в следовании инструкциям, понимании структурированных данных и генерации структурированных Output, особенно в формате JSON....
Total Context:
33K
Max output:
4K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens

Qwen
Text Generation
Qwen2.5-14B-Instruct
Выпуск: 18 сент. 2024 г.
Qwen2.5-14B-Instruct является одной из последних серий крупных языковых моделей, выпущенных Alibaba Cloud. Эта модель с 14B демонстрирует значительные улучшения в таких областях, как программирование и математика. Модель также предлагает поддержку нескольких языков, охватывая более 29 языков, включая китайский и английский. Она показала заметные достижения в следовании инструкциям, понимании структурированных данных и генерации структурированных Outputs, особенно в формате JSON....
Total Context:
33K
Max output:
4K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens

Qwen
Text Generation
Qwen2.5-7B-Instruct
Выпуск: 18 сент. 2024 г.
Qwen2.5-7B-Instruct является одной из последних серий больших языковых моделей, выпущенных Alibaba Cloud. Эта 7B Model демонстрирует значительные улучшения в таких областях, как программирование и математика. Модель также предлагает многоязыковую поддержку, охватывая более 29 языков, включая китайский, английский и другие. Модель показывает заметные улучшения в следовании инструкциям, понимании структурированных данных и генерации структурированных Output, особенно JSON....
Total Context:
33K
Max output:
4K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens

