模型

产品

定价

文档

博客

关于

联系

🎉 LongCat-2.0 可以在 SiliconFlow 上使用。现在就尝试吧。

🎉 LongCat-2.0 可以在 SiliconFlow 上使用。现在就尝试吧。

模型

Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct

API 参考

关于Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct 是阿里巴巴 Qwen 团队发布的下一代基础模型。它基于新的 Qwen3-Next 架构构建，旨在实现卓越的训练和推理效率。该模型融合了创新特性，如混合注意力机制（门控DeltaNet和门控注意力）、高稀疏性专家混合（MoE）结构以及各种稳定性优化。作为一个800亿参数的稀疏模型，它在推理期间每个 token 仅激活约30亿个参数，这显著降低了计算成本，并且在超长上下文任务（超过32K tokens）中，其吞吐量比Qwen3-32B 模型高出10倍以上。这是一个针对通用任务优化的指令调优版本，不支持“思考”模式。在性能方面，它在某些基准测试中与Qwen 的旗舰模型Qwen3-235B相当，在超长上下文场景中表现出显著优势。

用例

探索如何Qwen3-Next-80B-A3B-Instruct的超长上下文和高效推理解决复杂的大规模问题。

超长文档合成

处理并合成来自法律简报、研究论文或历史档案等海量文档的见解，利用其100万token上下文。

使用案例示例：

"一个法律团队使用它来分析5000页的发现文件，提取关键论据并在几分钟内识别相关判例法。"

大规模代码库分析

通过识别建筑模式、依赖关系和重构机会来理解和优化庞大的代码库，跨越数百万行代码。

使用案例示例：

"一家工程公司使用它来重构遗留Python应用程序，映射模块交互并为关键数据管道建议性能改进。"

高级金融市场情报

分析广泛的实时和历史金融数据、新闻和经济报告以预测市场趋势并制定复杂的交易策略。

使用案例示例：

"一位金融分析师使用模型处理十年的全球市场数据和新闻文章，识别微妙的相关性以制定新的算法交易策略。"

全面的监管合规性

自动审计复杂的监管框架和内部政策与运营数据，以确保合规并识别风险。

使用案例示例：

"一家医疗服务提供者利用它将患者数据处理与HIPAA法规进行交叉引用，标记潜在的隐私违规行为并建议政策更新。"

科学发现加速

通过分析大量的科学文献和实验数据加速研究，以生成假设、设计实验和验证发现。

使用案例示例：

"一位材料科学研究人员使用它来筛选数千篇期刊文章和实验结果，提出具有所需属性的新合金成分。"

元数据

创建

2025年9月18日

许可证

APACHE-2.0

提供者

Qwen

HuggingFace

Qwen3-Next-80B-A3B-Instruct

规格

州

Deprecated

建筑

Hybrid Attention MoE

校准的

不

专家混合

是

总参数

80B

激活的参数

3B

推理

不

精度

FP8

上下文长度

262K

最大输出长度

262K

与其他模型进行比较

看看这个模型与其他模型相比表现如何。

Qwen

chat

Qwen3-VL-32B-Instruct

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

发行日期：2025年10月15日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

发行日期：2025年10月15日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

发行日期：2025年10月4日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

发行日期：2025年10月4日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

发行日期：2025年10月5日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

发行日期：2025年10月11日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

发行日期：2025年8月13日

$

0.29

/ Video

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·