Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct

Qwen/Qwen3-Next-80B-A3B-Instruct

關於Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct 是由阿里巴巴的 Qwen 團隊推出的下一代基礎模型。它基於新的 Qwen3-Next 架構,旨在實現終極訓練和推理效率。該模型融合了創新特性,如混合注意力機制(Gated DeltaNet 和門控注意力)、高稀疏度專家混合模型 (MoE) 結構,以及各種穩定性優化。作為一個具有 800 億參數的稀疏模型,它在推理過程中每個 token 只激活約 30 億參數,大大降低了計算成本,並且在長上下文任務中實現了比 Qwen3-32B 模型高出 10 倍以上的吞吐量,超出 32K tokens 。這是一個為通用任務優化的指令調整版本,不支持“思考”模式。在性能方面,它可與 Qwen 的旗艦模型 Qwen3-235B 相媲美,並在超長上下文場景中顯示出顯著優勢。

可用的無伺服器

立即運行查詢,僅按使用量付費

$

0.14

$

1.4

每百萬 Tokens(輸入/輸出)

元數據

創建於

2025年9月18日

許可證

APACHE-2.0

供應商

Qwen

規格

狀態

Available

架構

經過校準的

專家並行

總參數

80B

啟用的參數

3B

推理

精度

FP8

上下文長度

262K

最大輸出長度

262K

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

不支持

JSON 模式

支持

結構化輸出

不支持

工具

支持

中間填充補全

不支持

聊天前綴補全

支持

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow