目錄
簡而言之:DeepSeek-V3.2(V3.2-Exp的官方版本)現已在SiliconFlow上線。作為為代理構建的推理優先模型,它結合了高效率和GPT-5級推理表現,以及一個164K上下文窗口。此外,它還具有在思考模式下的工具使用能力,在85K+複雜指令和1,800+環境中得到驗證。立即開始使用SiliconFlow的API進行構建,以提升您的代理工作流程。
我們很高興能夠解鎖DeepSeek的最新模型在SiliconFlow上的訪問權限,DeepSeek-V3.2,一個新系列,將計算效率與卓越的推理和代理性能相結合。作為首個直接將思考集成到工具使用中的DeepSeek模型,DeepSeek-V3.2提供GPT-5 級的推理,並顯著縮短輸出。同時,DeepSeek-V3.2-Speciale推動定理證明和編碼的開源界限以競爭Gemini 3 Pro。它們共同為打造下一代AI代理的開發者樹立了新的標杆。
現在,透過SiliconFlow的DeepSeek-V3.2 API,您可以期待:
成本效益:
DeepSeek-V3.2 $0.27/M tokens(輸入)和 $0.42/M tokens(輸出)
DeepSeek-V3.2-Speciale即將推出,敬請期待第一手更新
164K上下文窗口:非常適合長文檔,複雜的多輪對話和延長的代理任務。
無縫整合: 立刻通過SiliconFlow的OpenAI兼容API部署,或透過Claude Code、Gen-CLI和Cline接入您現有的堆棧。
無論您是在構建代理、編碼助手,還是複雜的推理流水線,SiliconFlow的DeepSeek-V3.2 API都能以預期成本和延遲的零頭提供您所需的性能。
為什麼這很重要
對於構建代理、步驟繁多的推理流水線或任何需要思考和行動的AI系統的開發者來說,DeepSeek-V3.2系列最終實現了產業一直期待的組合:前沿級推理、思考過程中的工具使用集成,以及現實世界的效率:
世界領先的推理能力
DeepSeek-V3.2: 代理的高效“日常驅動器”
旨在在推理能力和輸出長度之間取得完美平衡,DeepSeek-V3.2是您生產流程的首選,比如高級問答和通用代理任務。
性能: 提供與GPT-5相當的推理能力。
效率: 與Kimi-K2-Thinking相比,V3.2具有顯著縮短的輸出長度,轉化為更低的計算開銷和減少的整體生成時間。
DeepSeek-V3.2-Speciale: 推理能力達到峰值(研究預覽)
作為V3.2的增強型長思考變體,V3.2-Speciale旨在推動開源推理能力的界限,集成DeepSeek-Math-V2的定理證明能力。
金牌性能: V3.2-Speciale在IMO, CMO, ICPC世界決賽 & IOI 2025中獲得金牌級結果。
基準: 在複雜的指令跟隨、嚴格的數學推理和邏輯驗證方面表現出色,有效競爭主流推理排行榜上的Gemini 3 Pro。
基準 | DeepSeek-V3.2 Speciale | DeepSeek-V3.2思考 | GPT-5高 | Gemini-3.0 Pro | Kimi-K2思考 |
AIME 2025 | 🥇96.0 (23k) | 93.1 (16k) | 94.6 (13k) | 95.0 (15k) | 94.5 (24k) |
HMMT Feb 2025 | 🥇99.2 (27k) | 92.5 (19k) | 88.3 (16k) | 97.5 (16k) | 89.4 (31k) |
HMMT Nov 2025 | 🥇94.4 (25k) | 90.2 (18k) | 89.2 (20k) | 93.3 (15k) | 89.2 (29k) |
IMOAnswerBench | 🥇84.5 (45k) | 78.3 (27k) | 76.0 (31k) | 83.3 (18k) | 78.6 (37k) |
LiveCodeBench | 88.7 (27k) | 83.3 (16k) | 84.5 (13k) | 90.7 (13k) | 82.6 (29k) |
CodeForces | 2701 (77k) | 2386 (42k) | 2537 (29k) | 2708 (22k) | - |
GPQA Diamond | 85.7 (16k) | 82.4 (7k) | 85.7 (8k) | 91.9 (8k) | 84.5 (12k) |
HLE | 30.6 (35k) | 25.1 (21k) | 26.3 (15k) | 37.7 (15k) | 23.9 (24k) |
括號中的數字表示大約總token消耗。
在工具使用中思考
DeepSeek-V3.2打破了“推理”和“行動”之間的障礙。與先前版本中思考過程中工具使用被限制不同,DeepSeek-V3.2是首個直接將思考融入工具使用,支持在思考和非思考模式中調用工具的版本。
為了提供這種級別的代理可靠性,DeepSeek引入了一種大規模訓練合成方法:
強大的泛化能力: 該模型通過“難以解決,易於驗證”的強化學習任務鍛造而成。
廣泛覆蓋: 訓練覆蓋1,800+個不同的環境和超過85,000+個複雜指令,顯著增強了模型在代理上下文中的泛化和指令跟隨能力。
基準 | DeepSeek-V3.2思考 | GPT-5-高 | Gemini-3.0-Pro | Kimi-K2思考 | MiniMax M2 |
τ² Bench (Pass@1) | 80.3 | 80.2 | 85.4 | 74.3 | 76.9 |
MCP-Universe | 45.9 | 47.9 | 50.7 | 35.6 | 29.4 |
MCP-Mark | 38 | 50.9 | 43.1 | 20.4 | 24.4 |
工具十項全能 (Pass@1) | 35.2 | 29 | 36.4 | 17.6 | 16 |
這對您的工作流程的意義:
DeepSeek-V3.2成為代理場景中一個高性價比的替代方案,顯著縮小開源和前沿專有模型之間的性能差距,同時承擔的成本遠低於預期——這一切都可以通過SiliconFlow的API獲得。
以下是使用SiliconFlow的DeepSeek-V3.2 API構建的示例,演示了模型如何幫助編寫、優化和推理由即時互動代碼。

其強大之處
DeepSeek-V3.2系列的性能源於三項核心技術突破:
DeepSeek稀疏注意力 (DSA):
為了解決長上下文處理的挑戰,該模型引入了DeepSeek稀疏注意力(DSA)。這一高效的注意力機制大大減少了計算複雜性,卻不損性能,專為長上下文場景優化。
可擴展的強化學習:
DeepSeek-V3.2利用強大的強化學習(RL)協定結合擴展的後訓練計算。這一先進的訓練框架是該模型卓越推理能力的關鍵驅動力。
大規模代理任務合成流水線:
DeepSeek通過新穎的大規模代理任務合成流水線改變代理能力。通過系統地生成大規模訓練數據,模型將推理直接集成到工具使用情境中。這帶來了卓越的合規性和泛化性,確保您的代理能夠可靠地在複雜的多步互動環境中精確導航。
開發者就緒集成
除了DeepSeek-V3.2的行業領先代理性能外,SiliconFlow還提供與您現有開發生態系統的即時兼容性:
OpenAI兼容工具: 與Cline、Qwen Code、Gen-CLI和其他標準開發環境的無縫整合——只需插入您的SiliconFlow API密鑰。
Anthropic兼容API:與Claude Code和任何Anthropic兼容工具一起使用以進行代碼審查、調試和架構重構。
平台整合:可以在Dify、ChatHub、Chatbox、Sider、MindSearch、DB-GPT中即時使用,亦可通過OpenRouter獲得。
擁有強大的模型、無縫的整合和具競爭力的定價,SiliconFlow將徹底改變您的構建方式——讓您更快地交付並更智能地擴展。
立即開始
探索: 在SiliconFlow體驗中心中試用DeepSeek-V3.2 。
整合: 使用我們的OpenAI兼容API。在SiliconFlow API文檔中探索完整的API規範。

