模型

產品

定價

文檔

部落格

關於

聯繫

🎉 Nex-N2-Pro可在 SiliconFlow 上使用。現在就試試看。

🎉 Nex-N2-Pro可在 SiliconFlow 上使用。現在就試試看。

模型

Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct

API 參考

關於Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct 是由阿里巴巴的 Qwen 團隊推出的下一代基礎模型。它基於新的 Qwen3-Next 架構，旨在實現終極訓練和推理效率。該模型融合了創新特性，如混合注意力機制（Gated DeltaNet 和門控注意力）、高稀疏度專家混合模型 (MoE) 結構，以及各種穩定性優化。作為一個具有 800 億參數的稀疏模型，它在推理過程中每個 token 只激活約 30 億參數，大大降低了計算成本，並且在長上下文任務中實現了比 Qwen3-32B 模型高出 10 倍以上的吞吐量，超出 32K tokens 。這是一個為通用任務優化的指令調整版本，不支持“思考”模式。在性能方面，它可與 Qwen 的旗艦模型 Qwen3-235B 相媲美，並在超長上下文場景中顯示出顯著優勢。

用例

探索Qwen3-Next-80B-A3B-Instruct超長上下文和高效推理如何解決複雜、大規模問題。

超長文件綜合

處理並綜合法律簡報、研究論文或歷史檔案等大量文件中的洞見，利用其1M token上下文。

使用案例示例：

"一個法律團隊使用它分析5000頁的披露文件，提取關鍵論點並在幾分鐘內識別相關判例法。"

大規模代碼庫分析

理解並優化大規模代碼庫，識別架構模式、依賴性和跨數百萬行代碼的重構機會。

使用案例示例：

"一家工程公司使用它重構一個舊的Python應用程序，映射模塊互動並為關鍵數據管道提出性能改進建議。"

高級金融市場情報

分析大量的實時和歷史金融數據、新聞和經濟報告，以預測市場趨勢並制定複雜的交易策略。

使用案例示例：

"一位金融分析師使用模型處理十年的全球市場數據和新聞文章，識別新算法交易策略的微妙相關性。"

全面的監管合規

自動審計複雜的監管框架和內部政策對操作數據的合規性，並識別風險。

使用案例示例：

"一家醫療提供者利用它對患者數據處理進行與HIPAA法規的交叉參考，標記潛在的隱私違規並建議政策更新。"

科學發現加速

通過分析大量科學文獻和實驗數據，加速研究以生成假設、設計實驗和驗證結果。

使用案例示例：

"一名材料科學研究人員使用它篩選數千篇期刊文章和實驗結果，提出具有所需特性的嶄新合金配方。"

元數據

創建於

2025年9月18日

許可證

APACHE-2.0

供應商

Qwen

HuggingFace

Qwen3-Next-80B-A3B-Instruct

規格

狀態

Deprecated

架構

Hybrid Attention MoE

經過校準的

否

專家並行

是

總參數

80B

啟用的參數

3B

推理

否

精度

FP8

上下文長度

262K

最大輸出長度

262K

與其他模型比較

看看這個模型與其他模型的對比如何。

Qwen

chat

Qwen3.6-35B-A3B

發行日期：2026年5月9日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.2

/ M Tokens

輸出：

$

1.6

/ M Tokens

Qwen

chat

Qwen3.6-27B

發行日期：2026年5月9日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.3

/ M Tokens

輸出：

$

3.2

/ M Tokens

Qwen

chat

Qwen3.5-397B-A17B

發行日期：2026年5月9日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.39

/ M Tokens

輸出：

$

2.34

/ M Tokens

Qwen

chat

Qwen3.5-122B-A10B

發行日期：2026年5月9日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.26

/ M Tokens

輸出：

$

2.08

/ M Tokens

Qwen

chat

Qwen3.5-35B-A3B

發行日期：2026年5月9日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.24

/ M Tokens

輸出：

$

1.8

/ M Tokens

Qwen

chat

Qwen3.5-27B

發行日期：2026年5月9日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.25

/ M Tokens

輸出：

$

2.0

/ M Tokens

Qwen

chat

Qwen3.5-9B

發行日期：2026年5月9日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.1

/ M Tokens

輸出：

$

0.15

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Instruct

發行日期：2025年10月21日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.2

/ M Tokens

輸出：

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

發行日期：2025年10月21日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.2

/ M Tokens

輸出：

$

1.5

/ M Tokens

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·