關於DeepSeek-V3.2
DeepSeek-V3.2 是一個模型,結合了高計算效率與卓越的推理能力和代理性能。其方法建立在三個關鍵技術突破上:DeepSeek Sparse Attention (DSA),這是一種高效的注意力機制,大幅降低計算複雜性,並保持模型性能,特別針對長上下文場景進行優化;可擴展強化學習框架,實現與 GPT-5 相媲美的性能以及與 Gemini-3.0-Pro 高計算版本相當的推理能力;以及大規模代理任務綜合管道,將推理整合到工具使用場景中,提升在複雜互動環境中的合規性和概括性。該模型在 2025 年國際數學奧林匹克 (IMO) 和國際信息學奧林匹克 (IOI) 中獲得金牌成績。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.27
/
$
0.42
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
可用
架構
經過校準的
不
專家並行
不
總參數
671B
啟用的參數
671B
推理
不
精度
FP8
上下文長度
164K
最大輸出長度
164K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
支持
結構化輸出
不支持
工具
支持
中間填充補全
不支持
聊天前綴補全
支持
與其他模型比較
看看這個模型與其他模型的對比如何。
DeepSeek
聊天
DeepSeek-V3.2
發行日期:2025年12月4日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.27
/ M Tokens
輸出:
$
0.42
/ M Tokens
DeepSeek
聊天
DeepSeek-V3.2-Exp
發行日期:2025年10月10日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.27
/ M Tokens
輸出:
$
0.41
/ M Tokens
DeepSeek
聊天
DeepSeek-V3.1-Terminus
發行日期:2025年9月29日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.27
/ M Tokens
輸出:
$
1.0
/ M Tokens
DeepSeek
聊天
DeepSeek-V3.1
發行日期:2025年8月25日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.27
/ M Tokens
輸出:
$
1.0
/ M Tokens
DeepSeek
聊天
DeepSeek-V3
發行日期:2024年12月26日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.25
/ M Tokens
輸出:
$
1.0
/ M Tokens
DeepSeek
聊天
DeepSeek-R1
發行日期:2025年5月28日
總上下文:
164K
最大輸出:
164K
輸入:
$
0.5
/ M Tokens
輸出:
$
2.18
/ M Tokens
DeepSeek
聊天
DeepSeek-R1-Distill-Qwen-32B
發行日期:2025年1月20日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.18
/ M Tokens
輸出:
$
0.18
/ M Tokens
DeepSeek
聊天
DeepSeek-R1-Distill-Qwen-14B
發行日期:2025年1月20日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.1
/ M Tokens
輸出:
$
0.1
/ M Tokens
DeepSeek
聊天
DeepSeek-R1-Distill-Qwen-7B
發行日期:2025年1月20日
總上下文:
33K
最大輸出:
16K
輸入:
$
0.05
/ M Tokens
輸出:
$
0.05
/ M Tokens
