DeepSeek-V3.2 現已在 SiliconFlow 上：專為代理構建的推理優先模型

2025年12月8日

簡而言之：DeepSeek-V3.2（V3.2-Exp的官方版本）現已在SiliconFlow上線。作為為代理構建的推理優先模型，它結合了高效率和GPT-5級推理表現，以及一個164K上下文窗口。此外，它還具有在思考模式下的工具使用能力，在85K+複雜指令和1,800+環境中得到驗證。立即開始使用SiliconFlow的API進行構建，以提升您的代理工作流程。

我們很高興能夠解鎖DeepSeek的最新模型在SiliconFlow上的訪問權限，DeepSeek-V3.2，一個新系列，將計算效率與卓越的推理和代理性能相結合。作為首個直接將思考集成到工具使用中的DeepSeek模型，DeepSeek-V3.2提供GPT-5 級的推理，並顯著縮短輸出。同時，DeepSeek-V3.2-Speciale推動定理證明和編碼的開源界限以競爭Gemini 3 Pro。它們共同為打造下一代AI代理的開發者樹立了新的標杆。

現在，透過SiliconFlow的DeepSeek-V3.2 API，您可以期待：

成本效益:
- DeepSeek-V3.2 $0.27/M tokens（輸入）和 $0.42/M tokens（輸出）
- DeepSeek-V3.2-Speciale即將推出，敬請期待第一手更新
164K上下文窗口:非常適合長文檔，複雜的多輪對話和延長的代理任務。
無縫整合: 立刻通過SiliconFlow的OpenAI兼容API部署，或透過Claude Code、Gen-CLI和Cline接入您現有的堆棧。

無論您是在構建代理、編碼助手，還是複雜的推理流水線，SiliconFlow的DeepSeek-V3.2 API都能以預期成本和延遲的零頭提供您所需的性能。

為什麼這很重要

對於構建代理、步驟繁多的推理流水線或任何需要思考和行動的AI系統的開發者來說，DeepSeek-V3.2系列最終實現了產業一直期待的組合：前沿級推理、思考過程中的工具使用集成，以及現實世界的效率：

世界領先的推理能力

DeepSeek-V3.2: 代理的高效“日常驅動器”

旨在在推理能力和輸出長度之間取得完美平衡，DeepSeek-V3.2是您生產流程的首選，比如高級問答和通用代理任務。

性能: 提供與GPT-5相當的推理能力。
效率: 與Kimi-K2-Thinking相比，V3.2具有顯著縮短的輸出長度，轉化為更低的計算開銷和減少的整體生成時間。

DeepSeek-V3.2-Speciale: 推理能力達到峰值（研究預覽）

作為V3.2的增強型長思考變體，V3.2-Speciale旨在推動開源推理能力的界限，集成DeepSeek-Math-V2的定理證明能力。

金牌性能: V3.2-Speciale在IMO, CMO, ICPC世界決賽 & IOI 2025中獲得金牌級結果。
基準: 在複雜的指令跟隨、嚴格的數學推理和邏輯驗證方面表現出色，有效競爭主流推理排行榜上的Gemini 3 Pro。

基準	DeepSeek-V3.2 Speciale	DeepSeek-V3.2思考	GPT-5高	Gemini-3.0 Pro	Kimi-K2思考
AIME 2025	🥇96.0 (23k)	93.1 (16k)	94.6 (13k)	95.0 (15k)	94.5 (24k)
HMMT Feb 2025	🥇99.2 (27k)	92.5 (19k)	88.3 (16k)	97.5 (16k)	89.4 (31k)
HMMT Nov 2025	🥇94.4 (25k)	90.2 (18k)	89.2 (20k)	93.3 (15k)	89.2 (29k)
IMOAnswerBench	🥇84.5 (45k)	78.3 (27k)	76.0 (31k)	83.3 (18k)	78.6 (37k)
LiveCodeBench	88.7 (27k)	83.3 (16k)	84.5 (13k)	90.7 (13k)	82.6 (29k)
CodeForces	2701 (77k)	2386 (42k)	2537 (29k)	2708 (22k)	-
GPQA Diamond	85.7 (16k)	82.4 (7k)	85.7 (8k)	91.9 (8k)	84.5 (12k)
HLE	30.6 (35k)	25.1 (21k)	26.3 (15k)	37.7 (15k)	23.9 (24k)

括號中的數字表示大約總token消耗。

在工具使用中思考

DeepSeek-V3.2打破了“推理”和“行動”之間的障礙。與先前版本中思考過程中工具使用被限制不同，DeepSeek-V3.2是首個直接將思考融入工具使用，支持在思考和非思考模式中調用工具的版本。

為了提供這種級別的代理可靠性，DeepSeek引入了一種大規模訓練合成方法：

強大的泛化能力: 該模型通過“難以解決，易於驗證”的強化學習任務鍛造而成。
廣泛覆蓋: 訓練覆蓋1,800+個不同的環境和超過85,000+個複雜指令，顯著增強了模型在代理上下文中的泛化和指令跟隨能力。

基準	DeepSeek-V3.2思考	GPT-5-高	Gemini-3.0-Pro	Kimi-K2思考	MiniMax M2
τ² Bench (Pass@1)	80.3	80.2	85.4	74.3	76.9
MCP-Universe	45.9	47.9	50.7	35.6	29.4
MCP-Mark	38	50.9	43.1	20.4	24.4
工具十項全能 (Pass@1)	35.2	29	36.4	17.6	16

這對您的工作流程的意義:

DeepSeek-V3.2成為代理場景中一個高性價比的替代方案，顯著縮小開源和前沿專有模型之間的性能差距，同時承擔的成本遠低於預期——這一切都可以通過SiliconFlow的API獲得。

以下是使用SiliconFlow的DeepSeek-V3.2 API構建的示例，演示了模型如何幫助編寫、優化和推理由即時互動代碼。

其強大之處

DeepSeek-V3.2系列的性能源於三項核心技術突破：

DeepSeek稀疏注意力 (DSA):

為了解決長上下文處理的挑戰，該模型引入了DeepSeek稀疏注意力(DSA)。這一高效的注意力機制大大減少了計算複雜性，卻不損性能，專為長上下文場景優化。

可擴展的強化學習:

DeepSeek-V3.2利用強大的強化學習(RL)協定結合擴展的後訓練計算。這一先進的訓練框架是該模型卓越推理能力的關鍵驅動力。

大規模代理任務合成流水線:

DeepSeek通過新穎的大規模代理任務合成流水線改變代理能力。通過系統地生成大規模訓練數據，模型將推理直接集成到工具使用情境中。這帶來了卓越的合規性和泛化性，確保您的代理能夠可靠地在複雜的多步互動環境中精確導航。

開發者就緒集成

除了DeepSeek-V3.2的行業領先代理性能外，SiliconFlow還提供與您現有開發生態系統的即時兼容性：

OpenAI兼容工具：與Cline、Qwen Code、Gen-CLI和其他標準開發環境的無縫整合——只需插入您的SiliconFlow API密鑰。
Anthropic兼容API：與Claude Code和任何Anthropic兼容工具一起使用以進行代碼審查、調試和架構重構。
平台整合：可以在Dify、ChatHub、Chatbox、Sider、MindSearch、DB-GPT中即時使用，亦可通過OpenRouter獲得。

擁有強大的模型、無縫的整合和具競爭力的定價，SiliconFlow將徹底改變您的構建方式——讓您更快地交付並更智能地擴展。

立即開始

探索: 在SiliconFlow體驗中心中試用DeepSeek-V3.2 。
整合: 使用我們的OpenAI兼容API。在SiliconFlow API文檔中探索完整的API規範。

      import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "deepseek-ai/DeepSeek-V3.2",
    "messages": [
        {
            "role": "user",
            "content": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea"
        }
    ],
    "stream": True,
    "max_tokens": 4096,
    "enable_thinking": False,
    "thinking_budget": 4096,
    "min_p": 0,
    "stop": "1",
    "temperature": 0.7,
    "top_p": 0.7,
    "top_k": 50,
    "frequency_penalty": 0.5,
    "n": 1,
    "response_format": { "type": "json_object" },
    "tools": [
        {
            "type": "function",
            "function": {
                "name": "<string>",
                "description": "<string>",
                "parameters": {},
                "strict": False
            }
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

      import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "deepseek-ai/DeepSeek-V3.2",
    "messages": [
        {
            "role": "user",
            "content": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea"
        }
    ],
    "stream": True,
    "max_tokens": 4096,
    "enable_thinking": False,
    "thinking_budget": 4096,
    "min_p": 0,
    "stop": "1",
    "temperature": 0.7,
    "top_p": 0.7,
    "top_k": 50,
    "frequency_penalty": 0.5,
    "n": 1,
    "response_format": { "type": "json_object" },
    "tools": [
        {
            "type": "function",
            "function": {
                "name": "<string>",
                "description": "<string>",
                "parameters": {},
                "strict": False
            }
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

      import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "deepseek-ai/DeepSeek-V3.2",
    "messages": [
        {
            "role": "user",
            "content": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea"
        }
    ],
    "stream": True,
    "max_tokens": 4096,
    "enable_thinking": False,
    "thinking_budget": 4096,
    "min_p": 0,
    "stop": "1",
    "temperature": 0.7,
    "top_p": 0.7,
    "top_k": 50,
    "frequency_penalty": 0.5,
    "n": 1,
    "response_format": { "type": "json_object" },
    "tools": [
        {
            "type": "function",
            "function": {
                "name": "<string>",
                "description": "<string>",
                "parameters": {},
                "strict": False
            }
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)