DeepSeek-V3.2-Exp 现在在 SiliconFlow 上：高效的长上下文推理，成本降低 50%

2025年10月14日

精简摘要: DeepSeek-V3.2-Exp, DeepSeek 系列中的最新实验性模型, 现已在 SiliconFlow 上线。它采用 DeepSeek Sparse Attention (DSA) 实现细粒度高效性，提供更快更佳的长上下文推理、编码和代理搜索性能——具备密集级质量、164K上下文窗口，通过 SiliconFlow 的产品级 API 服务无缝集成。

我们很高兴地宣布，DeepSeek-V3.2-Exp, DeepSeek 系列中的最新实验性模型，现已在 SiliconFlow 上提供。此次发布提供了高效长上下文推理的未来视角。作为通向 DeepSeek 下一代架构的桥梁，DeepSeek-V3.2-Exp 引入了 DeepSeek Sparse Attention (DSA)——一种显著增强训练和推理效率的细粒度机制，适用于扩展文本、代码和推理任务。

通过 SiliconFlow API，您可以期待:

成本效益定价：DeepSeek-V3.2-Exp $0.27/M tokens （Input）和 $0.41/M tokens （Output）。
更长的上下文，更少的开销：164K 上下文窗口让您可以分析或生成更长的文档、对话或脚本，而无需昂贵的截断。
无缝集成：通过 SiliconFlow 的OpenAI/Anthropic 兼容 API即时部署，或通过Claude Code, Gen-CLi 和 Cline 等接入您的现有技术栈。

通过强大的模型，无缝的集成，以及具成本效益的定价，SiliconFlow 改变了开发人员的构建方式——让您更快发布、更智能扩展。

为何此版本很重要

DeepSeek-V3.2-Exp 构建在 DeepSeek-V3.1-Terminus 的基础上，标志着 DeepSeek 在研究更高效的 Transformer 架构方面迈出的重要一步。

其新的 DeepSeek Sparse Attention 机制首次实现了细粒度稀疏性，在长上下文训练和推理中提供了显著的速度和内存收益，同时保持了与稠密注意力相同的输出质量。

为了确保严格的评估，DeepSeek-V3.2-Exp 在与 DeepSeek-V3.1-Terminus 相同的设置下进行训练，并在多个公开基准测试中表现出可比较的性能和稳定性，验证稀疏注意力作为一种更高效的可靠路径。

基准		DeepSeek-V3.1-Terminus	DeepSeek-V3.2-Exp
通用	MMLU-Pro	85.0	85.0
	GPQA-Diamond	80.7	79.9
	人类最后的考试	21.7	19.8
搜索代理	BrowseComp	38.5	40.1
	BrowseComp-zh	45.0	47.9
	SimpleQA	96.8	97.1
代码	LiveCodeBench	74.9	74.1
	Codeforces-Div1	2046	2121
	Aider-Polyglot	76.1	74.5
代码代理	SWE Verified	68.4	67.8
	SWE-bench Multilingual	57.8	57.9
	Terminal-bench	36.7	37.7
数学	AIME 2025	88.4	89.3
	HMMT 2025	86.1	83.6

访问 SiliconFlow 的 DeepSeek-V3.2-Exp API 服务

让我们先来了解一下 DeepSeek-V3.2-Exp 在 SiliconFlow 模型广场上的表现。

在经典的“两火车”问题测试中，DeepSeek-V3.2-Exp 高效推理步骤——识别关键变量，建立方程并验证结果。最重要的是，最终答案——171 ¹⁄₉ 公里——正确且推理清晰。

除了交互式模型广场，SiliconFlow 还提供与现有开发生态系统的即时兼容性：

Anthropic 生态系统支持：与 Anthropic 生态系统完全兼容，用于全面的代码审查、错误跟踪以及通过 Claude Code 使用 DeepSeek-V3.2-Exp 进行架构重构。
开发者工具集成：与 Cline、Qwen Code、Gen-CLI 及其他 OpenAI 标准开发工具无缝兼容——只需使用您的 SiliconFlow API 访问 DeepSeek-V3.2-Exp 的功能。
其他支持平台：提供与 Dify、Sider、MindSearch、DB-GPT、ChatHub 和 Chatbox 的即用型集成，利用 DeepSeek-V3.2-Exp 及其他强大模型。

拥有强大的模型，无缝的集成和具成本效益的定价，SiliconFlow 改变了您的构建方式——让您更快发布、更智能扩展。

立即开始

准备深入探索吗？以下是开始的方法：

1. 探索: 在DeepSeek-V3.2-Exp的SiliconFlow 模型广场中尝试。
2. 集成: 使用我们的 OpenAI 兼容 API。在SiliconFlow API 文档中探索完整的 API 规格。

import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "deepseek-ai/DeepSeek-V3.2-Exp",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": False,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": None,    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())

import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "deepseek-ai/DeepSeek-V3.2-Exp",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": False,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": None,    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())

import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "deepseek-ai/DeepSeek-V3.2-Exp",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": False,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": None,    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())

今天开始在 SiliconFlow 上使用 DeepSeek-V3.2-Exp 构建——为您的应用程序提供更快、更智能和更具成本效益的 AI。

商业或销售咨询 →

立即加入我们的 Discord 社区 →

在 X 上关注我们以获取最新更新 →

探索 SiliconFlow 上所有可用的模型 →

上一个