模型

产品

定价

文档

博客

关于

联系

🎉 Kimi-K3 可以在 SiliconFlow 上使用。现在就尝试吧。

模型

DeepSeek-R1-0120

API 参考

关于DeepSeek-R1-0120

DeepSeek-R1 是一个利用强化学习（RL）驱动的推理模型，解决了重复性和可读性问题。在引入 RL 之前，DeepSeek-R1 利用了冷启动数据来进一步优化其推理性能。它在数学、代码和推理任务上实现了与 OpenAI-o1 相当的性能，并通过精心设计的训练方法，提升了整体效能。

用例

元数据

创建

2025年1月20日

许可证

提供者

DeepSeek

HuggingFace

DeepSeek-R1-0120

规格

州

Deprecated

建筑

校准的

不

专家混合

不

总参数

671B

激活的参数

推理

不

精度

FP8

上下文长度

66K

最大输出长度

与其他模型进行比较

看看这个模型与其他模型相比表现如何。

DeepSeek

chat

DeepSeek-V3.2

发行日期：2025年12月4日

上下文长度：

164K

最大输出长度：

164K

Input:

0.27

/ M Tokens

Output:

0.42

/ M Tokens

DeepSeek

chat

DeepSeek-V3.2-Exp

发行日期：2025年10月10日

上下文长度：

164K

最大输出长度：

164K

Input:

0.27

/ M Tokens

Output:

0.41

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1-Terminus

发行日期：2025年9月29日

上下文长度：

164K

最大输出长度：

164K

Input:

0.27

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1

发行日期：2025年8月25日

上下文长度：

164K

最大输出长度：

164K

Input:

0.27

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-V3

发行日期：2024年12月26日

上下文长度：

164K

最大输出长度：

164K

Input:

0.25

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-R1

发行日期：2025年5月28日

上下文长度：

164K

最大输出长度：

164K

Input:

0.5

/ M Tokens

Output:

2.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-32B

发行日期：2025年1月20日

上下文长度：

131K

最大输出长度：

131K

Input:

0.18

/ M Tokens

Output:

0.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-14B

发行日期：2025年1月20日

上下文长度：

131K

最大输出长度：

131K

Input:

0.1

/ M Tokens

Output:

0.1

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-7B

发行日期：2025年1月20日

上下文长度：

33K

最大输出长度：

16K

Input:

0.05

/ M Tokens

Output:

0.05

/ M Tokens

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

页面

模型S

产品

页面

模型S

产品

页面

模型S

产品