Qwen3-Omni-30B-A3B-Captioner

Qwen3-Omni-30B-A3B-Captioner

Qwen/Qwen3-Omni-30B-A3B-Captioner

О Qwen3-Omni-30B-A3B-Captioner

Qwen3-Omni-30B-A3B-Captioner — это Vision-Language Model (VLM) от команды Qwen компании Alibaba, являющаяся частью серии Qwen3. Она специально разработана для генерации высококачественных, подробных и точных Image подписей. Основанная на архитектуре Mixture of Experts (MoE) с общим параметром в 30B, модель может глубоко понимать содержимое Image и переводить его в богатый, естественный Text.

Доступный Serverless

Запускайте запросы немедленно, платите только за использование

$

0.1

/

$

0.4

За 1 миллион Tokens (Input/Output)

Метаданные

Создать на

4 окт. 2025 г.

Лицензия

-

Поставщик

Qwen

Спецификация

Государство

Available

Архитектура

Калибровка

Да

Смешение экспертов

Да

Общее количество параметров

30B

Активированные параметры

Мышление

Нет

Точность

ФП8

Контекст length

66K

Максимум Tokens

66K

поддерживается функциональность

Безсерверный

поддерживается

Безсерверный LoRA

Не поддерживается

Тонкая настройка

Не поддерживается

Embeddings

Не поддерживается

Rerankers

Не поддерживается

Поддержка Image Input

поддерживается

Режим JSON

поддерживается

Структурированные Outputs

Не поддерживается

Инструменты

поддерживается

Завершение погашения

поддерживается

Chat Префикс Заполнение

поддерживается

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Russian (Russia)
Russian (Russia)
Russian (Russia)