

モデル比較
QwQ-32B
対
Qwen3-Next-80B-A3B-Instruct
2026/02/28

価格
Input
$
0.15
/ M Tokens
$
0.14
/ M Tokens
Output
$
0.58
/ M Tokens
$
1.4
/ M Tokens
メタデータ
作成する
2025/03/05
2025/09/09
ライセンス
APACHE-2.0
APACHE-2.0
プロバイダー
Qwen
Qwen
仕様
州
Available
Available
建築
transformers with RoPE, SwiGLU, RMSNorm, and Attention QKV bias, with 64 layers and GQA (40 Q attention heads, 8 for KV)
Qwen3-Next architecture featuring Hybrid Attention (Gated DeltaNet and Gated Attention), High-Sparsity Mixture-of-Experts (MoE), Stability Optimizations, and Multi-Token Prediction (MTP)
キャリブレートされた
いいえ
いいえ
専門家の混合
いいえ
はい
合計パラメータ
32B
80B
アクティブ化されたパラメータ
32.5B
3B
推論
いいえ
いいえ
Precision
FP8
FP8
コンテキスト長
131K
262K
Max Tokens
131K
262K
対応機能
Serverless
対応
対応
Serverless LoRA
サポートされていません
サポートされていません
Fine-tuning
サポートされていません
サポートされていません
Embeddings
サポートされていません
サポートされていません
Rerankers
サポートされていません
サポートされていません
Image入力をサポートする
サポートされていません
サポートされていません
JSON Mode
サポートされていません
対応
構造化されたOutputs
サポートされていません
サポートされていません
ツール
対応
対応
Fim Completion
サポートされていません
サポートされていません
Chat Prefix Completion
サポートされていません
対応
QwQ-32B比較において
見てくださいQwQ-32B主要な次元において他の人気のあるモデルと比較します。
VS

Qwen3-VL-32B-Instruct
VS

Qwen3-VL-32B-Thinking
VS

Qwen3-VL-8B-Instruct
VS

Qwen3-VL-8B-Thinking
VS

Qwen3-VL-30B-A3B-Instruct
VS

Qwen3-VL-30B-A3B-Thinking
VS

Qwen3-Omni-30B-A3B-Instruct
VS

Ring-flash-2.0
VS

Qwen3-Omni-30B-A3B-Captioner
VS

Qwen3-Omni-30B-A3B-Thinking
VS

Qwen3-Next-80B-A3B-Instruct
VS

Qwen3-Next-80B-A3B-Thinking
VS
gpt-oss-120b
VS
gpt-oss-20b
VS

Qwen3-Coder-30B-A3B-Instruct
VS

Qwen3-30B-A3B-Thinking-2507
VS

Qwen3-30B-A3B-Instruct-2507
VS

Qwen3-14B
VS

Qwen3-30B-A3B
VS

Qwen3-32B
