約deepseek-vl2
DeepSeek-VL2は、DeepSeekMoE-27Bに基づいて開発された混合専門家(MoE)ビジョン-言語モデルであり、疎活性化MoEアーキテクチャを採用して4.5Bの活性パラメータのみで優れたパフォーマンスを達成します。 このModelは、視覚的質問応答、光学文字認識、文書/テーブル/チャート理解、視覚的グラウンディングなど、さまざまなタスクで優れています。 既存のオープンソースの密結合モデルおよびMoEベースのモデルと比較して、同等または最先端のパフォーマンスを同じまたは少ない活性パラメータで示します。
DeepSeek-VL2の高度なVision-Language機能が、様々な業種において複雑な現実世界の問題をどのように解決するかを探求します。
知的文書処理
OCRと視覚的理解を活用して、請求書、契約書、レポートなどの多様な文書からデータ抽出と分析を自動化します。
ユースケース例:
"会計事務所向けにスキャンした財務諸表から重要な数値を自動的に抽出し、データベースに入力することで、手動データ入力を80%削減します。"
ビジュアルコンテンツ分析
画像やVideo内のオブジェクト、シーン、または不適切なコンテンツを識別および分類して、モデレーション、検索、または分析を行います。
ユースケース例:
"プロhibited itemsやユーザーがアップロードしたeコマース製品のImageにおける敏感なコンテンツをフラグし、プラットフォームガイドラインおよびブランドの安全性を確保します。"
自動Imageキャプション生成
視覚障がい者へのアクセス向上およびコンテンツSEOの改善を図るために、Imageに対する詳細かつコンテキストに即した説明を生成します。
ユースケース例:
"複雑な医療MRIスキャンに対して豊かなTextual descriptionを提供し、医師や患者に対する所見の説明やWeb imageのためのalt-textを生成します。"
eコマース製品強化
Improved search、推薦、および在庫管理のために、製品Imageに属性、ブランド、およびカテゴリーを自動的にタグ付けします。
ユースケース例:
"衣料品のImageを分析し、そのスタイル、色、素材、ブランドをロゴから識別し、オンラインカタログシステムの製品メタデータに入力します。"
メタデータ
仕様
州
Deprecated
建築
キャリブレートされた
いいえ
専門家の混合
はい
合計パラメータ
27B
アクティブ化されたパラメータ
4.5B
推論
いいえ
Precision
FP8
コンテキスト長
4K
Max Tokens
4K
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。
DeepSeek
chat
DeepSeek-V3.2
リリース日:2025/12/04
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
リリース日:2025/10/10
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
リリース日:2025/09/29
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
リリース日:2025/08/25
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3
リリース日:2024/12/26
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-R1
リリース日:2025/05/28
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
リリース日:2025/01/20
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
リリース日:2025/01/20
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
リリース日:2025/01/20
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
