關於deepseek-vl2
DeepSeek-VL2 是一種混合專家 (MoE) 視覺-語言 模型,基於 DeepSeekMoE-27B 開發,採用稀疏激活的 MoE 架構,以僅 45 億活躍參數實現卓越的性能。該 模型 在各種任務中表現出色,包括視覺問答、光學字符識別、文件/表格/圖表理解和視覺對位。與現有的開源密集模型和基於 MoE 的 模型 相比,它在使用相同或更少的活躍參數的情況下,展現出具有競爭力或者最先進的性能。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.15
/
$
0.15
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
Available
架構
經過校準的
否
專家並行
是
總參數
27B
啟用的參數
4.5B
推理
否
精度
FP8
上下文長度
4K
最大輸出長度
4K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
支持
JSON 模式
支持
結構化輸出
不支持
工具
不支持
中間填充補全
不支持
聊天前綴補全
支持
與其他模型比較
看看這個模型與其他模型的對比如何。
DeepSeek
chat
DeepSeek-V3.2
發行日期:2025年12月4日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.27
/ M Tokens
輸出:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
發行日期:2025年10月10日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.27
/ M Tokens
輸出:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
發行日期:2025年9月29日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.27
/ M Tokens
輸出:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
發行日期:2025年8月25日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.27
/ M Tokens
輸出:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3
發行日期:2024年12月26日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.25
/ M Tokens
輸出:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-R1
發行日期:2025年5月28日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.5
/ M Tokens
輸出:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
發行日期:2025年1月20日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.18
/ M Tokens
輸出:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
發行日期:2025年1月20日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.1
/ M Tokens
輸出:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
發行日期:2025年1月20日
總上下文:
33K
最大輸出:
16K
輸入:
$
0.05
/ M Tokens
輸出:
$
0.05
/ M Tokens
