模型

产品

定价

文档

博客

关于

联系

🎉 LongCat-2.0 可以在 SiliconFlow 上使用。现在就尝试吧。

🎉 LongCat-2.0 可以在 SiliconFlow 上使用。现在就尝试吧。

模型

Qwen3-Next-80B-A3B-Thinking

Qwen3-Next-80B-A3B-Thinking

API 参考

关于Qwen3-Next-80B-A3B-Thinking

Qwen3-Next-80B-A3B-Thinking 是阿里巴巴的 Qwen 团队推出的新一代基础模型，专为复杂的推理任务而设计。它基于创新的 Qwen3-Next 架构，结合混合注意力机制（门控 DeltaNet 和门控注意力）与高稀疏性专家混合（MoE）结构，以实现最终的训练和推理效率。作为一个800亿参数的稀疏模型，它在推理过程中只激活约30亿参数，显著降低了计算成本，并在超过32K tokens 的长上下文任务中提供超过10倍的吞吐量。这个“Thinking”版本专为复杂的多步问题（如数学证明、代码合成、逻辑分析和代理规划）而优化，并默认输出结构化的“思考”痕迹。在性能方面，它超过了成本更高的模型，如 Qwen3-32B-Thinking，并在多个基准测试中超越了 Gemini-2.5-Flash-Thinking。

用例

探索Qwen3-Next-80B-A3B-Thinking无与伦比的推理能力和超长上下文能力如何应用于解决不同行业中最复杂的现实世界问题。

先进科学论证与发现

利用Qwen3-Next的深度推理生成并严格验证复杂数学证明，分析实验数据，并将研究成果综合成连贯的分步骤科学论文。

用例示例：

"协助量子计算团队验证一种新颖的加密算法，通过生成其安全属性的形式证明，识别出需要微调的细小缺陷，加速同行评审。"

深度代码分析与优化

使用Qwen3-Next的超长上下文和推理分析庞大的代码库，以查找难以捉摸的逻辑漏洞，优化算法以提高效率，并通过详细的分步骤解释重构复杂系统。

用例示例：

"通过跨10万行代码追踪服务间通信模式，发现分布式Go微服务中的竞争条件，提供了一个稳定的并发安全解决方案，提高了系统稳定性。"

高级财务策略与风险

对详尽的财务文件和实时市场数据进行多层次定量分析，识别微妙的相关性，预测市场变化，并制定全面的风险缓解策略。

用例示例：

"处理一年的全球经济指标和公司供应链数据以预测商品价格波动，实施前瞻性的对冲策略，节省了数百万的采购成本。"

智能合规与审计

通过推理逻辑依赖关系，自动审计复杂的监管文件、工程蓝图或法律协议，检测不合规情况，并通过详细解释突出关键漏洞。

用例示例：

"对一家制药公司500页的监管合规文件与其内部标准操作规程进行审计，识别出15个关键差异并建议精准修改以避免潜在的罚款和法律问题。"

动态项目与资源规划

利用Qwen3-Next进行多阶段项目规划，优化资源分配，识别关键路径依赖关系，并生成复杂、不断变化的运营挑战的自适应策略，附详细推理。

用例示例：

"为卫星星座项目开发了优化部署计划，综合考虑发射窗口、轨道力学和资源限制，通过智能任务排序将总体项目时间缩短了18%。"

元数据

创建

2025年9月25日

许可证

APACHE-2.0

提供者

Qwen

HuggingFace

Qwen3-Next-80B-A3B-Thinking

规格

州

Deprecated

建筑

Qwen3-Next

校准的

不

专家混合

是

总参数

80B

激活的参数

3B

推理

不

精度

FP8

上下文长度

262K

最大输出长度

262K

与其他模型进行比较

看看这个模型与其他模型相比表现如何。

Qwen

chat

Qwen3-VL-32B-Instruct

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

发行日期：2025年10月15日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

发行日期：2025年10月15日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

发行日期：2025年10月4日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

发行日期：2025年10月4日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

发行日期：2025年10月5日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

发行日期：2025年10月11日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

发行日期：2025年8月13日

$

0.29

/ Video

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·