DeepSeek-V3.2-Exp 现在在 SiliconFlow 上:高效的长上下文推理,成本降低 50%

2025年10月14日

目录

DeepSeek-V3.2-Exp 现已在 SiliconFlow 上

精简摘要: DeepSeek-V3.2-Exp, DeepSeek 系列中的最新实验性模型, 现已在 SiliconFlow 上线。它采用 DeepSeek Sparse Attention (DSA) 实现细粒度高效性,提供更快更佳的长上下文推理编码代理搜索性能——具备密集级质量、164K上下文窗口,通过 SiliconFlow 的产品级 API 服务无缝集成。


我们很高兴地宣布,DeepSeek-V3.2-Exp, DeepSeek 系列中的最新实验性模型,现已在 SiliconFlow 上提供。此次发布提供了高效长上下文推理的未来视角。作为通向 DeepSeek 下一代架构的桥梁,DeepSeek-V3.2-Exp 引入了 DeepSeek Sparse Attention (DSA)——一种显著增强训练和推理效率的细粒度机制,适用于扩展文本、代码和推理任务。


通过 SiliconFlow API,您可以期待:


  • 成本效益定价:DeepSeek-V3.2-Exp $0.27/M tokens (Input)和 $0.41/M tokens (Output)。

  • 更长的上下文,更少的开销:164K 上下文窗口让您可以分析或生成更长的文档、对话或脚本,而无需昂贵的截断。

  • 无缝集成:通过 SiliconFlow 的OpenAI/Anthropic 兼容 API即时部署,或通过Claude Code, Gen-CLi 和 Cline 等接入您的现有技术栈。


通过强大的模型,无缝的集成,以及具成本效益的定价,SiliconFlow 改变了开发人员的构建方式——让您更快发布、更智能扩展


为何此版本很重要


DeepSeek-V3.2-Exp 构建在 DeepSeek-V3.1-Terminus 的基础上,标志着 DeepSeek 在研究更高效的 Transformer 架构方面迈出的重要一步。

其新的 DeepSeek Sparse Attention 机制首次实现了细粒度稀疏性,在长上下文训练和推理中提供了显著的速度和内存收益,同时保持了与稠密注意力相同的输出质量。


Image


为了确保严格的评估,DeepSeek-V3.2-Exp 在与 DeepSeek-V3.1-Terminus 相同的设置下进行训练,并在多个公开基准测试中表现出可比较的性能和稳定性,验证稀疏注意力作为一种更高效的可靠路径。


基准


DeepSeek-V3.1-Terminus

DeepSeek-V3.2-Exp

通用

MMLU-Pro

85.0

85.0


GPQA-Diamond

80.7

79.9


人类最后的考试

21.7

19.8

搜索代理

BrowseComp

38.5

40.1


BrowseComp-zh

45.0

47.9


SimpleQA

96.8

97.1

代码

LiveCodeBench

74.9

74.1


Codeforces-Div1

2046

2121


Aider-Polyglot

76.1

74.5

代码代理

SWE Verified

68.4

67.8


SWE-bench Multilingual

57.8

57.9


Terminal-bench

36.7

37.7

数学

AIME 2025

88.4

89.3


HMMT 2025

86.1

83.6



访问 SiliconFlow 的 DeepSeek-V3.2-Exp API 服务

让我们先来了解一下 DeepSeek-V3.2-Exp 在 SiliconFlow 模型广场上的表现。


在经典的“两火车”问题测试中,DeepSeek-V3.2-Exp 高效推理步骤——识别关键变量,建立方程并验证结果。最重要的是,最终答案——171 ¹⁄₉ 公里——正确且推理清晰。


Image


除了交互式模型广场,SiliconFlow 还提供与现有开发生态系统的即时兼容性:

  • Anthropic 生态系统支持:与 Anthropic 生态系统完全兼容,用于全面的代码审查、错误跟踪以及通过 Claude Code 使用 DeepSeek-V3.2-Exp 进行架构重构。

  • 开发者工具集成:与 Cline、Qwen Code、Gen-CLI 及其他 OpenAI 标准开发工具无缝兼容——只需使用您的 SiliconFlow API 访问 DeepSeek-V3.2-Exp 的功能。

  • 其他支持平台:提供与 Dify、Sider、MindSearch、DB-GPT、ChatHub 和 Chatbox 的即用型集成,利用 DeepSeek-V3.2-Exp 及其他强大模型。

拥有强大的模型,无缝的集成和具成本效益的定价,SiliconFlow 改变了您的构建方式——让您更快发布、更智能扩展。


立即开始


准备深入探索吗?以下是开始的方法:


  1. 1. 探索:DeepSeek-V3.2-ExpSiliconFlow 模型广场中尝试。

  2. 2. 集成: 使用我们的 OpenAI 兼容 API。在SiliconFlow API 文档中探索完整的 API 规格。


import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "deepseek-ai/DeepSeek-V3.2-Exp",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": False,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": None,    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())
import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "deepseek-ai/DeepSeek-V3.2-Exp",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": False,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": None,    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())
import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "deepseek-ai/DeepSeek-V3.2-Exp",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": False,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": None,    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())


今天开始在 SiliconFlow 上使用 DeepSeek-V3.2-Exp 构建——为您的应用程序提供更快、更智能和更具成本效益的 AI。


商业或销售咨询 →

立即加入我们的 Discord 社区 →

在 X 上关注我们以获取最新更新 →

探索 SiliconFlow 上所有可用的模型 →

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?