模型

产品

定价

文档

博客

关于

联系

🎉 gemma-4-31B-it 可以在 SiliconFlow 上使用。现在就尝试吧。

🎉 gemma-4-31B-it 可以在 SiliconFlow 上使用。现在就尝试吧。

模型

QwQ-32B

QwQ-32B

API 参考

关于QwQ-32B

QwQ是Qwen系列的推理模型。与传统指令调整模型相比，QwQ能够思考和推理，可以在下游任务中实现显著增强的性能，特别是难题。QwQ-32B是中型推理模型，能够在性能上与最先进的推理模型，例如DeepSeek-R1、o1-mini竞争。该模型融入了RoPE、SwiGLU、RMSNorm和Attention QKV bias等技术，具有64层和40个Q注意力头（8个用于GQA架构中的KV）

用例

探索 QwQ-32B 强大的思维和推理能力如何在各个领域解决复杂的现实世界问题。

高级科学问题解决

通过分析复杂数据集、生成和验证数学证明，以及起草具有连贯、逐步推理的技术论文来加速科学发现。

用例示例：

"通过在 Python 中推导和验证复杂分子轨道方程，辅助量子化学团队，显著加快理论模型开发。"

深度代码分析和优化

不仅仅是简单的代码完成。利用 QwQ-32B 分析整个代码库，识别细微的逻辑错误，并基于对算法的深刻理解提出性能优化建议。

用例示例：

"通过跟踪服务间通信，找出 Go 微服务架构中的死锁条件，为提高系统稳定性提供了一个稳健的解决方案。"

战略金融 RAG

利用 QwQ-32B 对财务报告和市场数据进行多步骤定量分析，推断因果关系，并生成详细的战略建议。

用例示例：

"为新兴加密货币衍生品市场开发出复杂的风险评估模型，识别潜在的套利机会和系统性漏洞。"

智能系统验证

部署 QwQ-32B 审计复杂系统，如合规性框架或工程图，通过推理逻辑依赖关系、识别不一致性并标记潜在问题。

用例示例：

"审核大型工业控制系统 (ICS) 配置，检测出安全协议中的一个微妙逻辑缺陷，可能导致操作失败。"

元数据

创建

2025年3月6日

许可证

APACHE-2.0

提供者

Qwen

HuggingFace

规格

州

Deprecated

建筑

Causal Decoder Transformer

校准的

不

专家混合

不

总参数

32B

激活的参数

32.5B

推理

不

精度

FP8

上下文长度

131K

最大输出长度

131K

与其他模型进行比较

看看这个模型与其他模型相比表现如何。

Qwen

chat

Qwen3.6-35B-A3B

发行日期：2026年4月17日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.6

/ M Tokens

Qwen

chat

Qwen3.6-27B

发行日期：2026年4月23日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.3

/ M Tokens

Output:

$

3.2

/ M Tokens

Qwen

chat

Qwen3.5-397B-A17B

发行日期：2026年4月24日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.39

/ M Tokens

Output:

$

2.34

/ M Tokens

Qwen

chat

Qwen3.5-122B-A10B

发行日期：2026年4月24日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.26

/ M Tokens

Output:

$

2.08

/ M Tokens

Qwen

chat

Qwen3.5-35B-A3B

发行日期：2026年2月25日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.24

/ M Tokens

Output:

$

1.8

/ M Tokens

Qwen

chat

Qwen3.5-27B

发行日期：2026年4月24日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.25

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3.5-9B

发行日期：2026年4月24日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.1

/ M Tokens

Output:

$

0.15

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Instruct

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·