DeepSeek-V3.2 現已在 SiliconFlow 上:專為代理構建的推理優先模型

2025年12月8日

目錄

簡而言之:DeepSeek-V3.2(V3.2-Exp的官方版本)現已在SiliconFlow上線。作為為代理構建的推理優先模型,它結合了高效率和GPT-5級推理表現,以及一個164K上下文窗口。此外,它還具有在思考模式下的工具使用能力,在85K+複雜指令和1,800+環境中得到驗證。立即開始使用SiliconFlow的API進行構建,以提升您的代理工作流程。

我們很高興能夠解鎖DeepSeek的最新模型在SiliconFlow上的訪問權限,DeepSeek-V3.2,一個新系列,將計算效率與卓越的推理和代理性能相結合。作為首個直接將思考集成到工具使用中的DeepSeek模型,DeepSeek-V3.2提供GPT-5 的推理,並顯著縮短輸出。同時,DeepSeek-V3.2-Speciale推動定理證明和編碼的開源界限以競爭Gemini 3 Pro。它們共同為打造下一代AI代理的開發者樹立了新的標杆。

現在,透過SiliconFlow的DeepSeek-V3.2 API,您可以期待:

  • 成本效益:

    • DeepSeek-V3.2 $0.27/M tokens(輸入)和 $0.42/M tokens(輸出)

    • DeepSeek-V3.2-Speciale即將推出,敬請期待第一手更新

  • 164K上下文窗口:非常適合長文檔,複雜的多輪對話和延長的代理任務。

  • 無縫整合: 立刻通過SiliconFlow的OpenAI兼容API部署,或透過Claude Code、Gen-CLI和Cline接入您現有的堆棧。


無論您是在構建代理、編碼助手,還是複雜的推理流水線,SiliconFlow的DeepSeek-V3.2 API都能以預期成本和延遲的零頭提供您所需的性能。


為什麼這很重要

對於構建代理、步驟繁多的推理流水線或任何需要思考和行動的AI系統的開發者來說,DeepSeek-V3.2系列最終實現了產業一直期待的組合:前沿級推理、思考過程中的工具使用集成,以及現實世界的效率:

  1. 世界領先的推理能力

  • DeepSeek-V3.2: 代理的高效“日常驅動器”

旨在在推理能力和輸出長度之間取得完美平衡,DeepSeek-V3.2是您生產流程的首選,比如高級問答和通用代理任務。

  • 性能: 提供與GPT-5相當的推理能力。

  • 效率:Kimi-K2-Thinking相比,V3.2具有顯著縮短的輸出長度,轉化為更低的計算開銷和減少的整體生成時間


  • DeepSeek-V3.2-Speciale: 推理能力達到峰值(研究預覽)

作為V3.2的增強型長思考變體,V3.2-Speciale旨在推動開源推理能力的界限,集成DeepSeek-Math-V2的定理證明能力。

  • 金牌性能: V3.2-Speciale在IMO, CMO, ICPC世界決賽 & IOI 2025中獲得金牌級結果。

  • 基準: 在複雜的指令跟隨、嚴格的數學推理和邏輯驗證方面表現出色,有效競爭主流推理排行榜上的Gemini 3 Pro


基準

DeepSeek-V3.2 Speciale

DeepSeek-V3.2思考

GPT-5高

Gemini-3.0 Pro

Kimi-K2思考

AIME 2025

🥇96.0 (23k)

93.1 (16k)

94.6 (13k)

95.0 (15k)

94.5 (24k)

HMMT Feb 2025

🥇99.2 (27k)

92.5 (19k)

88.3 (16k)

97.5 (16k)

89.4 (31k)

HMMT Nov 2025

🥇94.4 (25k)

90.2 (18k)

89.2 (20k)

93.3 (15k)

89.2 (29k)

IMOAnswerBench

🥇84.5 (45k)

78.3 (27k)

76.0 (31k)

83.3 (18k)

78.6 (37k)

LiveCodeBench

88.7 (27k)

83.3 (16k)

84.5 (13k)

90.7 (13k)

82.6 (29k)

CodeForces

2701 (77k)

2386 (42k)

2537 (29k)

2708 (22k)

-

GPQA Diamond

85.7 (16k)

82.4 (7k)

85.7 (8k)

91.9 (8k)

84.5 (12k)

HLE

30.6 (35k)

25.1 (21k)

26.3 (15k)

37.7 (15k)

23.9 (24k)

括號中的數字表示大約總token消耗。


  1. 在工具使用中思考

DeepSeek-V3.2打破了“推理”和“行動”之間的障礙。與先前版本中思考過程中工具使用被限制不同,DeepSeek-V3.2是首個直接將思考融入工具使用,支持在思考和非思考模式中調用工具的版本。

為了提供這種級別的代理可靠性,DeepSeek引入了一種大規模訓練合成方法:

  • 強大的泛化能力: 該模型通過“難以解決,易於驗證”的強化學習任務鍛造而成。

  • 廣泛覆蓋: 訓練覆蓋1,800+個不同的環境和超過85,000+個複雜指令,顯著增強了模型在代理上下文中的泛化和指令跟隨能力。


基準

DeepSeek-V3.2思考

GPT-5-高

Gemini-3.0-Pro

Kimi-K2思考

MiniMax M2

τ² Bench (Pass@1)

80.3

80.2

85.4

74.3

76.9

MCP-Universe

45.9

47.9

50.7

35.6

29.4

MCP-Mark

38

50.9

43.1

20.4

24.4

工具十項全能 (Pass@1)

35.2

29

36.4

17.6

16


這對您的工作流程的意義:

DeepSeek-V3.2成為代理場景中一個高性價比的替代方案,顯著縮小開源和前沿專有模型之間的性能差距,同時承擔的成本遠低於預期——這一切都可以通過SiliconFlow的API獲得。

以下是使用SiliconFlow的DeepSeek-V3.2 API構建的示例,演示了模型如何幫助編寫、優化和推理由即時互動代碼。


其強大之處

DeepSeek-V3.2系列的性能源於三項核心技術突破:

  • DeepSeek稀疏注意力 (DSA):

為了解決長上下文處理的挑戰,該模型引入了DeepSeek稀疏注意力(DSA)。這一高效的注意力機制大大減少了計算複雜性,卻不損性能,專為長上下文場景優化。

  • 可擴展的強化學習:

DeepSeek-V3.2利用強大的強化學習(RL)協定結合擴展的後訓練計算。這一先進的訓練框架是該模型卓越推理能力的關鍵驅動力。

  • 大規模代理任務合成流水線:

DeepSeek通過新穎的大規模代理任務合成流水線改變代理能力。通過系統地生成大規模訓練數據,模型將推理直接集成到工具使用情境中。這帶來了卓越的合規性和泛化性,確保您的代理能夠可靠地在複雜的多步互動環境中精確導航。


開發者就緒集成

除了DeepSeek-V3.2的行業領先代理性能外,SiliconFlow還提供與您現有開發生態系統的即時兼容性:

擁有強大的模型、無縫的整合和具競爭力的定價,SiliconFlow將徹底改變您的構建方式——讓您更快地交付並更智能地擴展。


立即開始

  1. 探索: 在SiliconFlow體驗中心中試用DeepSeek-V3.2

  2. 整合: 使用我們的OpenAI兼容API。在SiliconFlow API文檔中探索完整的API規範。

      import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "deepseek-ai/DeepSeek-V3.2",
    "messages": [
        {
            "role": "user",
            "content": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea"
        }
    ],
    "stream": True,
    "max_tokens": 4096,
    "enable_thinking": False,
    "thinking_budget": 4096,
    "min_p": 0,
    "stop": "1",
    "temperature": 0.7,
    "top_p": 0.7,
    "top_k": 50,
    "frequency_penalty": 0.5,
    "n": 1,
    "response_format": { "type": "json_object" },
    "tools": [
        {
            "type": "function",
            "function": {
                "name": "<string>",
                "description": "<string>",
                "parameters": {},
                "strict": False
            }
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)


準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow