Qwen3-Embedding-0.6B
О Qwen3-Embedding-0.6B
Qwen3-Embedding-0.6B является последней проприетарной моделью в серии Qwen3 Embedding, специально разработанной для задач текстового встраивания и ранжирования. Построенная на основе плотных фундаментальных моделей серии Qwen3, эта модель с 0.6B параметрами поддерживает длины контекста до 32K и может генерировать встраивания с размерами до 1024. Модель наследует исключительные мультиязычные возможности, поддерживающие более 100 языков, а также навыки понимания длинного текста и рассуждения. Она достигает высокой производительности на многоязычной лидерборде MTEB (оценка 64.33) и демонстрирует отличные результаты в различных задачах, включая извлечение текста, извлечение кода, классификацию текста, кластеризацию и майнинг двуязычных текстов. Модель предлагает гибкие размеры векторов (от 32 до 1024) и возможности, осведомленные об инструкциях, для улучшенной производительности в конкретных задачах и сценариях, делая её идеальным выбором для приложений, приоритетизирующих как эффективность, так и результативность.
Доступный Serverless
Запускайте запросы немедленно, платите только за использование
$
0.01
На 1М token
Метаданные
Спецификация
Государство
Available
Архитектура
Калибровка
Да
Смешение экспертов
Нет
Общее количество параметров
1B
Активированные параметры
0.6B
Мышление
Нет
Точность
ФП8
Контекст length
33K
Максимум Tokens
поддерживается функциональность
Безсерверный
поддерживается
Безсерверный LoRA
Не поддерживается
Тонкая настройка
Не поддерживается
Embeddings
поддерживается
Rerankers
Не поддерживается
Поддержка Image Input
Не поддерживается
Режим JSON
Не поддерживается
Структурированные Outputs
Не поддерживается
Инструменты
Не поддерживается
Завершение погашения
Не поддерживается
Chat Префикс Заполнение
Не поддерживается
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.

Qwen
chat
Qwen3-VL-32B-Instruct
Выпуск: 21 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
Выпуск: 21 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
Выпуск: 15 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
Выпуск: 15 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
Выпуск: 4 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
Выпуск: 4 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
Выпуск: 5 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
Выпуск: 11 окт. 2025 г.
Общий Контекст:
262K
Максимальный Output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
Выпуск: 13 авг. 2025 г.
$
0.29
/ Video
