

モデル比較
Qwen3-Next-80B-A3B-Instruct
対
Ring-flash-2.0
2026/02/28

価格
Input
$
0.14
/ M Tokens
$
0.14
/ M Tokens
Output
$
1.4
/ M Tokens
$
0.57
/ M Tokens
メタデータ
作成する
2025/09/09
2025/09/19
ライセンス
APACHE-2.0
MIT LICENSE
プロバイダー
Qwen
inclusionAI
仕様
州
Available
Available
建築
Qwen3-Next architecture featuring Hybrid Attention (Gated DeltaNet and Gated Attention), High-Sparsity Mixture-of-Experts (MoE), Stability Optimizations, and Multi-Token Prediction (MTP)
Mixture-of-Experts (MoE) with 1/32 expert activation ratio and MTP layers, featuring low activation and high sparsity design
キャリブレートされた
いいえ
はい
専門家の混合
はい
はい
合計パラメータ
80B
100B
アクティブ化されたパラメータ
3B
6.1B
推論
いいえ
いいえ
Precision
FP8
FP8
コンテキスト長
262K
131K
Max Tokens
262K
131K
対応機能
Serverless
対応
対応
Serverless LoRA
サポートされていません
サポートされていません
Fine-tuning
サポートされていません
サポートされていません
Embeddings
サポートされていません
サポートされていません
Rerankers
サポートされていません
サポートされていません
Image入力をサポートする
サポートされていません
サポートされていません
JSON Mode
対応
サポートされていません
構造化されたOutputs
サポートされていません
サポートされていません
ツール
対応
サポートされていません
Fim Completion
サポートされていません
サポートされていません
Chat Prefix Completion
対応
対応
Qwen3-Next-80B-A3B-Instruct比較において
見てくださいQwen3-Next-80B-A3B-Instruct主要な次元において他の人気のあるモデルと比較します。
VS

Qwen3-VL-32B-Instruct
VS

Qwen3-VL-32B-Thinking
VS

Qwen3-VL-8B-Instruct
VS

Qwen3-VL-8B-Thinking
VS

Qwen3-VL-30B-A3B-Instruct
VS

Qwen3-VL-30B-A3B-Thinking
VS

Qwen3-VL-235B-A22B-Instruct
VS

Qwen3-VL-235B-A22B-Thinking
VS

Qwen3-Omni-30B-A3B-Instruct
VS

Ring-flash-2.0
VS

Qwen3-Omni-30B-A3B-Captioner
VS

Qwen3-Omni-30B-A3B-Thinking
VS

Qwen3-Next-80B-A3B-Thinking
VS
gpt-oss-120b
VS
gpt-oss-20b
VS

step3
VS
deepseek-vl2
VS
Seed-OSS-36B-Instruct
