关于DeepSeek-V3.1
DeepSeek-V3.1是一种混合模型,支持思维模式和非思维模式。通过后期训练优化,该模型在工具使用和代理任务方面的性能显著提高。DeepSeek-V3.1-Think在回答质量上可与DeepSeek-R1-0528相媲美,同时响应速度更快。
可用的 Serverless
立即运行查询,仅按使用量付费
$
0.27
/
$
1
每 100 万 token(Input/Output)
元数据
规格
州
Available
建筑
校准的
是
专家混合
是
总参数
671B
激活的参数
37B
推理
不
精度
FP8
上下文长度
164K
最大输出长度
164K
支持功能
Serverless
支持
Serverless LoRA
不支持
微调
不支持
Embeddings
不支持
Rerankers
不支持
支持 Image Input
不支持
JSON Mode
支持
结构化Outputs
不支持
工具
支持
FIM 补全
支持
对话前缀补全
支持
与其他模型进行比较
看看这个模型与其他模型相比表现如何。
DeepSeek
chat
DeepSeek-V3.2
发行日期:2025年12月4日
上下文长度:
164K
最大输出长度:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
发行日期:2025年10月10日
上下文长度:
164K
最大输出长度:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
发行日期:2025年9月29日
上下文长度:
164K
最大输出长度:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
发行日期:2025年8月25日
上下文长度:
164K
最大输出长度:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3
发行日期:2024年12月26日
上下文长度:
164K
最大输出长度:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-R1
发行日期:2025年5月28日
上下文长度:
164K
最大输出长度:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
发行日期:2025年1月20日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
发行日期:2025年1月20日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
发行日期:2025年1月20日
上下文长度:
33K
最大输出长度:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
