deepseek-vl2
О deepseek-vl2
DeepSeek-VL2 — это смешанный эксперт (MoE) Vision-языковая Model, разработанная на базе DeepSeekMoE-27B, использующая разреженную активированную MoE архитектуру для достижения превосходной производительности при всего 4.5B активных параметрах. Model превосходит в различных задачах, включая визуальные вопросы и ответы, оптическое распознавание символов, понимание документов/таблиц/графиков и визуальное заземление. В сравнении с существующими опенсорсными плотными моделями и моделями на основе MoE, она демонстрирует конкурентные или передовые показатели производительности, используя те же или меньшее количество активных параметров.
Узнайте, как передовые возможности Vision-Language DeepSeek-VL2 решают сложные, реальные проблемы в различных отраслях.
Интеллектуальная обработка документов
Автоматизируйте извлечение данных и анализ из различных документов, таких как счета-фактуры, контракты и отчеты, используя OCR и визуальное понимание.
Пример сценария использования:
"Автоматически извлекает ключевые показатели из сканированных финансовых отчетов и заполняет базу данных, сокращая ручной ввод данных на 80% для бухгалтерской фирмы."
Анализ визуального контента
Определяйте и классифицируйте объекты, сцены или нежелательный контент в Image и Video для модерации, поиска или аналитики.
Пример сценария использования:
"Отмечает запрещенные предметы или чувствительный контент в загруженных пользователями изображениях продуктов электронной коммерции, обеспечивая соблюдение руководящих принципов платформы и безопасность бренда."
Автоматическое описание Image
Генерируйте подробные, контекстуальные описания для Image, улучшая доступность для слабовидящих пользователей и повышая SEO контента.
Пример сценария использования:
"Предоставляет богатое текстовое описание для сложного медицинского МРТ-сканирования, объясняя результаты врачу или пациенту, или генерируя alt-текст для веб-изображений."
Обогащение продуктов электронной коммерции
Автоматически добавляйте теги к Image товаров с атрибутами, брендами и категориями для улучшения поиска, рекомендаций и управления запасами.
Пример сценария использования:
"Анализирует Image одежды для определения ее стиля, цвета, материала и бренда по логотипу, заполняя метаданные продукта для онлайн-каталога."
Метаданные
Спецификация
Государство
Deprecated
Архитектура
Sparse MoE VLM
Калибровка
Нет
Смешение экспертов
Да
Общее количество параметров
27B
Активированные параметры
4.5B
Мышление
Нет
Точность
ФП8
Контекст length
4K
Максимум Tokens
4K
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.
DeepSeek
chat
DeepSeek-V4-Pro
Выпуск: 24 апр. 2026 г.
Общий Контекст:
1049K
Максимальный Output:
393K
Input:
$
1.74
/ M Tokens
Output:
$
3.48
/ M Tokens
DeepSeek
chat
DeepSeek-V4-Flash
Выпуск: 24 апр. 2026 г.
Общий Контекст:
1049K
Максимальный Output:
393K
Input:
$
0.14
/ M Tokens
Output:
$
0.28
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2
Выпуск: 4 дек. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Выпуск: 10 окт. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Выпуск: 29 сент. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Выпуск: 25 авг. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Выпуск: 26 дек. 2024 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Выпуск: 28 мая 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
131K
Максимальный Output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
