
模型比较
DeepSeek-R1
对比
DeepSeek-V3.1-Terminus
2026年2月10日
定价
Input
$
0.5
/ M Tokens
$
0.27
/ M Tokens
Output
$
2.18
/ M Tokens
$
1
/ M Tokens
元数据
创建
2025年1月20日
2025年9月22日
许可证
MIT
MIT LICENSE
提供者
DeepSeek
DeepSeek
规格
州
Available
Available
建筑
MoE
Mixture of Experts
校准的
不
不
专家混合
是
是
总参数
671B
671B
激活的参数
37B
236B
推理
不
不
精度
FP8
FP8
上下文长度
164K
164K
最大输出长度
164K
164K
支持功能
Serverless
支持
支持
Serverless LoRA
不支持
不支持
微调
不支持
不支持
Embeddings
不支持
不支持
Rerankers
不支持
不支持
支持 Image Input
不支持
不支持
JSON Mode
支持
支持
结构化Outputs
不支持
不支持
工具
支持
支持
FIM 补全
支持
不支持
对话前缀补全
支持
支持
DeepSeek-R1比较中
看看DeepSeek-R1与其他流行模型在关键维度上进行比较。
对比

MiniMax-M2.5
对比

GLM-5
对比

Step-3.5-Flash
对比

GLM-4.7
对比

MiniMax-M2.1
对比

GLM-4.6V
对比
DeepSeek-V3.2
对比

DeepSeek-V3.1-Nex-N1
对比

Kimi-K2-Thinking
对比

MiniMax-M2
对比
DeepSeek-V3.2-Exp
对比

GLM-4.6
对比
DeepSeek-V3.1-Terminus
对比

Qwen3-VL-235B-A22B-Instruct
对比

Qwen3-VL-235B-A22B-Thinking
对比

Ring-flash-2.0
对比

Ling-flash-2.0
对比

Kimi-K2-Instruct-0905
对比
DeepSeek-V3.1
对比

GLM-4.5V
