模型

产品

定价

文档

博客

关于

联系

🎉 gemma-4-31B-it 可以在 SiliconFlow 上使用。现在就尝试吧。

🎉 gemma-4-31B-it 可以在 SiliconFlow 上使用。现在就尝试吧。

模型

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B

API 参考

关于DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B 是一个基于 Qwen2.5-Math-7B 的精简模型。该模型通过 DeepSeek-R1 生成的 80 万个精心挑选的样本进行微调，展现出了强大的推理能力。在各种基准测试中取得了令人印象深刻的结果，包括在 MATH-500 上达到 92.8% 的准确率，在 AIME 2024 上通过率达到 55.5%，在 CodeForces 上评级达到了 1189，显示出其在数学和编程上的显著能力，对于一个 7B 规模的模型而言异常出色。

用例

探索DeepSeek-R1-Distill-Qwen-7B强大的推理、数学和编程能力如何高效地应用于解决复杂的现实世界问题。

高级数学问题解决

通过利用模型生成和验证证明、求解方程和推导公式的能力，从理论物理到复杂工程，解决复杂的数学挑战。

用例示例：

"一位材料科学家使用模型推导出描述新合金热性能的偏微分方程组，大大加快了实验设计。"

智能代码分析和优化

通过深度逻辑推理提高软件质量，识别细微的漏洞，优化算法，并在不同编程范式中重构复杂代码。

用例示例：

"通过识别出不高效的排序算法并建议更高性能、更节省内存的替代方案，优化了用Python编写的关键数据处理流程，将执行时间减少了40%。"

量化金融模型

对市场数据和财务报告进行深入的量化分析，发现趋势、评估风险，并生成数据驱动的投资策略。

用例示例：

"通过分析历史交易数据和宏观经济指标开发了一个预测加密货币价格波动的模型，提供了详细的风险调整投资组合建议。"

自动化逻辑和合规审计

系统化审计复杂系统，从法规文件到网络配置，以检测逻辑不一致、合规漏洞和潜在漏洞。

用例示例：

"审计了一家大型企业的云基础设施配置文件（Terraform/YAML），识别出安全配置错误和政策违规，确保符合行业最佳实践。"

元数据

创建

2025年1月20日

许可证

MIT LICENSE

提供者

DeepSeek

HuggingFace

DeepSeek-R1-Distill-Qwen-7B

规格

州

Deprecated

建筑

Dense Transformer

校准的

不

专家混合

不

总参数

7B

激活的参数

7B

推理

不

精度

FP8

上下文长度

33K

最大输出长度

16K

与其他模型进行比较

看看这个模型与其他模型相比表现如何。

DeepSeek

chat

DeepSeek-V4-Pro

发行日期：2026年4月24日

上下文长度：

1049K

最大输出长度：

393K

Input:

$

1.74

/ M Tokens

Output:

$

3.48

/ M Tokens

DeepSeek

chat

DeepSeek-V4-Flash

发行日期：2026年4月24日

上下文长度：

1049K

最大输出长度：

393K

Input:

$

0.14

/ M Tokens

Output:

$

0.28

/ M Tokens

DeepSeek

chat

DeepSeek-V3.2

发行日期：2025年12月4日

上下文长度：

164K

最大输出长度：

164K

Input:

$

0.27

/ M Tokens

Output:

$

0.42

/ M Tokens

DeepSeek

chat

DeepSeek-V3.2-Exp

发行日期：2025年10月10日

上下文长度：

164K

最大输出长度：

164K

Input:

$

0.27

/ M Tokens

Output:

$

0.41

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1-Terminus

发行日期：2025年9月29日

上下文长度：

164K

最大输出长度：

164K

Input:

$

0.27

/ M Tokens

Output:

$

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-V3.1

发行日期：2025年8月25日

上下文长度：

164K

最大输出长度：

164K

Input:

$

0.27

/ M Tokens

Output:

$

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-V3

发行日期：2024年12月26日

上下文长度：

164K

最大输出长度：

164K

Input:

$

0.25

/ M Tokens

Output:

$

1.0

/ M Tokens

DeepSeek

chat

DeepSeek-R1

发行日期：2025年5月28日

上下文长度：

164K

最大输出长度：

164K

Input:

$

0.5

/ M Tokens

Output:

$

2.18

/ M Tokens

DeepSeek

chat

DeepSeek-R1-Distill-Qwen-32B

发行日期：2025年1月20日

上下文长度：

131K

最大输出长度：

131K

Input:

$

0.18

/ M Tokens

Output:

$

0.18

/ M Tokens

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·