deepseek-vl2
О deepseek-vl2
DeepSeek-VL2 — это смешанный эксперт (MoE) Vision-языковая Model, разработанная на базе DeepSeekMoE-27B, использующая разреженную активированную MoE архитектуру для достижения превосходной производительности при всего 4.5B активных параметрах. Model превосходит в различных задачах, включая визуальные вопросы и ответы, оптическое распознавание символов, понимание документов/таблиц/графиков и визуальное заземление. В сравнении с существующими опенсорсными плотными моделями и моделями на основе MoE, она демонстрирует конкурентные или передовые показатели производительности, используя те же или меньшее количество активных параметров.
Узнайте, как передовые возможности Vision-Language DeepSeek-VL2 решают сложные, реальные проблемы в различных отраслях.
Интеллектуальная обработка документов
Автоматизируйте извлечение данных и анализ из различных документов, таких как счета-фактуры, контракты и отчеты, используя OCR и визуальное понимание.
Пример сценария использования:
"Автоматически извлекает ключевые показатели из сканированных финансовых отчетов и заполняет базу данных, сокращая ручной ввод данных на 80% для бухгалтерской фирмы."
Анализ визуального контента
Определяйте и классифицируйте объекты, сцены или нежелательный контент в Image и Video для модерации, поиска или аналитики.
Пример сценария использования:
"Отмечает запрещенные предметы или чувствительный контент в загруженных пользователями изображениях продуктов электронной коммерции, обеспечивая соблюдение руководящих принципов платформы и безопасность бренда."
Автоматическое описание Image
Генерируйте подробные, контекстуальные описания для Image, улучшая доступность для слабовидящих пользователей и повышая SEO контента.
Пример сценария использования:
"Предоставляет богатое текстовое описание для сложного медицинского МРТ-сканирования, объясняя результаты врачу или пациенту, или генерируя alt-текст для веб-изображений."
Обогащение продуктов электронной коммерции
Автоматически добавляйте теги к Image товаров с атрибутами, брендами и категориями для улучшения поиска, рекомендаций и управления запасами.
Пример сценария использования:
"Анализирует Image одежды для определения ее стиля, цвета, материала и бренда по логотипу, заполняя метаданные продукта для онлайн-каталога."
Метаданные
Спецификация
Государство
Deprecated
Архитектура
Калибровка
Нет
Смешение экспертов
Да
Общее количество параметров
27B
Активированные параметры
4.5B
Мышление
Нет
Точность
ФП8
Контекст length
4K
Максимум Tokens
4K
Сравнить с другими Model
Посмотрите, как эта Model сравнивается с другими.
DeepSeek
chat
DeepSeek-V3.2
Выпуск: 4 дек. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Выпуск: 10 окт. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Выпуск: 29 сент. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Выпуск: 25 авг. 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Выпуск: 26 дек. 2024 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Выпуск: 28 мая 2025 г.
Общий Контекст:
164K
Максимальный Output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
131K
Максимальный Output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
131K
Максимальный Output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Выпуск: 20 янв. 2025 г.
Общий Контекст:
33K
Максимальный Output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
