deepseek-vl2

О deepseek-vl2

DeepSeek-VL2 — это смешанный эксперт (MoE) Vision-языковая Model, разработанная на базе DeepSeekMoE-27B, использующая разреженную активированную MoE архитектуру для достижения превосходной производительности при всего 4.5B активных параметрах. Model превосходит в различных задачах, включая визуальные вопросы и ответы, оптическое распознавание символов, понимание документов/таблиц/графиков и визуальное заземление. В сравнении с существующими опенсорсными плотными моделями и моделями на основе MoE, она демонстрирует конкурентные или передовые показатели производительности, используя те же или меньшее количество активных параметров.

Узнайте, как передовые возможности Vision-Language DeepSeek-VL2 решают сложные, реальные проблемы в различных отраслях.

Интеллектуальная обработка документов

Автоматизируйте извлечение данных и анализ из различных документов, таких как счета-фактуры, контракты и отчеты, используя OCR и визуальное понимание.

Пример сценария использования:

"Автоматически извлекает ключевые показатели из сканированных финансовых отчетов и заполняет базу данных, сокращая ручной ввод данных на 80% для бухгалтерской фирмы."

Анализ визуального контента

Определяйте и классифицируйте объекты, сцены или нежелательный контент в Image и Video для модерации, поиска или аналитики.

Пример сценария использования:

"Отмечает запрещенные предметы или чувствительный контент в загруженных пользователями изображениях продуктов электронной коммерции, обеспечивая соблюдение руководящих принципов платформы и безопасность бренда."

Автоматическое описание Image

Генерируйте подробные, контекстуальные описания для Image, улучшая доступность для слабовидящих пользователей и повышая SEO контента.

Пример сценария использования:

"Предоставляет богатое текстовое описание для сложного медицинского МРТ-сканирования, объясняя результаты врачу или пациенту, или генерируя alt-текст для веб-изображений."

Обогащение продуктов электронной коммерции

Автоматически добавляйте теги к Image товаров с атрибутами, брендами и категориями для улучшения поиска, рекомендаций и управления запасами.

Пример сценария использования:

"Анализирует Image одежды для определения ее стиля, цвета, материала и бренда по логотипу, заполняя метаданные продукта для онлайн-каталога."

Метаданные

Создать на

13 дек. 2024 г.

Лицензия

DEEPSEEK MODEL LICENSE

Поставщик

DeepSeek

HuggingFace

Спецификация

Государство

Deprecated

Архитектура

Калибровка

Нет

Смешение экспертов

Да

Общее количество параметров

27B

Активированные параметры

4.5B

Мышление

Нет

Точность

ФП8

Контекст length

4K

Максимум Tokens

4K

Сравнить с другими Model

Посмотрите, как эта Model сравнивается с другими.

DeepSeek

chat

DeepSeek-V3.2

Выпуск: 4 дек. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

0.42

/ M Tokens

DeepSeek

chat

DeepSeek-V3.2-Exp

Выпуск: 10 окт. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

0.41

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1-Terminus

Выпуск: 29 сент. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

1

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1

Выпуск: 25 авг. 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.27

/ M Tokens

Output:

$

1

/ M Tokens

DeepSeek

chat

DeepSeek-V3

Выпуск: 26 дек. 2024 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.25

/ M Tokens

Output:

$

1

/ M Tokens

DeepSeek

chat

DeepSeek-R1

Выпуск: 28 мая 2025 г.

Общий Контекст:

164K

Максимальный Output:

164K

Input:

$

0.5

/ M Tokens

Output:

$

2.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-32B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

131K

Максимальный Output:

131K

Input:

$

0.18

/ M Tokens

Output:

$

0.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-14B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

131K

Максимальный Output:

131K

Input:

$

0.1

/ M Tokens

Output:

$

0.1

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-7B

Выпуск: 20 янв. 2025 г.

Общий Контекст:

33K

Максимальный Output:

16K

Input:

$

0.05

/ M Tokens

Output:

$

0.05

/ M Tokens

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?