DeepSeek-V3.2

DeepSeek-V3.2

deepseek-ai/DeepSeek-V3.2

關於DeepSeek-V3.2

DeepSeek-V3.2 是一個模型,結合了高計算效率與卓越的推理能力和代理性能。其方法建立在三個關鍵技術突破上:DeepSeek Sparse Attention (DSA),這是一種高效的注意力機制,大幅降低計算複雜性,並保持模型性能,特別針對長上下文場景進行優化;可擴展強化學習框架,實現與 GPT-5 相媲美的性能以及與 Gemini-3.0-Pro 高計算版本相當的推理能力;以及大規模代理任務綜合管道,將推理整合到工具使用場景中,提升在複雜互動環境中的合規性和概括性。該模型在 2025 年國際數學奧林匹克 (IMO) 和國際信息學奧林匹克 (IOI) 中獲得金牌成績。

可用的無伺服器

立即運行查詢,僅按使用量付費

$

0.27

$

0.42

每百萬 Tokens(輸入/輸出)

元數據

創建於

2025年12月4日

許可證

MIT LICENSE

供應商

DeepSeek

HuggingFace

規格

狀態

可用

架構

經過校準的

專家並行

總參數

671B

啟用的參數

671B

推理

精度

FP8

上下文長度

164K

最大輸出長度

164K

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

不支持

JSON 模式

支持

結構化輸出

不支持

工具

支持

中間填充補全

不支持

聊天前綴補全

支持

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow