

Сравнение Model
Qwen3-Omni-30B-A3B-Thinking
против
Ring-flash-2.0
28 февр. 2026 г.

Цены
Input
$
0.1
/ M Tokens
$
0.14
/ M Tokens
Output
$
0.4
/ M Tokens
$
0.57
/ M Tokens
Метаданные
Создать на
15 сент. 2025 г.
19 сент. 2025 г.
Лицензия
-
MIT LICENSE
Поставщик
Qwen
inclusionAI
Спецификация
Государство
Available
Available
Архитектура
Thinker-Talker, MoE-based
Mixture-of-Experts (MoE) with 1/32 expert activation ratio and MTP layers, featuring low activation and high sparsity design
Калибровка
Нет
Да
Смешение экспертов
Да
Да
Общее количество параметров
30B
100B
Активированные параметры
30B
6.1B
Мышление
Нет
Нет
Точность
FP8
FP8
Длина контекста
66K
131K
Максимум Tokens
66K
131K
поддерживается функциональность
Безсерверный
поддерживается
поддерживается
Безсерверный LoRA
Не поддерживается
Не поддерживается
Тонкая настройка
Не поддерживается
Не поддерживается
Embeddings
Не поддерживается
Не поддерживается
Rerankers
Не поддерживается
Не поддерживается
Поддержка Image Input
Не поддерживается
Не поддерживается
Режим JSON
поддерживается
Не поддерживается
Структурированные Outputs
Не поддерживается
Не поддерживается
Инструменты
поддерживается
Не поддерживается
Завершение погашения
поддерживается
Не поддерживается
Chat Префикс Заполнение
поддерживается
поддерживается
Qwen3-Omni-30B-A3B-Thinkingв сравнении
Смотрите как Qwen3-Omni-30B-A3B-Thinkingсравнивается с другими популярными моделями по ключевым параметрам.
