Qwen2.5-VL-72B-Instruct

Qwen2.5-VL-72B-Instruct

Qwen/Qwen2.5-VL-72B-Instruct

О Qwen2.5-VL-72B-Instruct

Qwen2.5-VL — это Vision-Text Model в серии Qwen2.5, который демонстрирует значительные улучшения во многих аспектах: он обладает сильными возможностями визуального понимания, распознавая общие объекты при анализе Text, диаграмм и макетов в Image; он функционирует как визуальный агент, способный к рассуждениям и динамическому направлению инструментов; он может понимать Video продолжительностью более 1 часа и фиксировать ключевые события; он точно локализует объекты в Image, генерируя ограничивающие рамки или точки; и поддерживает структурированные Outputs для отсканированных данных, таких как счета и формы. Model демонстрирует отличные результаты на различных тестах, включая Image, Video и агентные задачи.

Доступный Serverless

Запускайте запросы немедленно, платите только за использование

$

0.59

/

$

0.59

За 1 миллион Tokens (Input/Output)

Метаданные

Создать на

28 янв. 2025 г.

Лицензия

-

Поставщик

Qwen

Спецификация

Государство

Available

Архитектура

Калибровка

Нет

Смешение экспертов

Нет

Общее количество параметров

72B

Активированные параметры

72B

Мышление

Нет

Точность

ФП8

Контекст length

131K

Максимум Tokens

4K

поддерживается функциональность

Безсерверный

поддерживается

Безсерверный LoRA

Не поддерживается

Тонкая настройка

Не поддерживается

Embeddings

Не поддерживается

Rerankers

Не поддерживается

Поддержка Image Input

поддерживается

Режим JSON

Не поддерживается

Структурированные Outputs

Не поддерживается

Инструменты

Не поддерживается

Завершение погашения

Не поддерживается

Chat Префикс Заполнение

поддерживается

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Russian (Russia)
Russian (Russia)
Russian (Russia)