

模型比較
GLM-5
對比
Qwen3-VL-235B-A22B-Thinking
2026年2月15日

定價
輸入
$
0.3
/ M Tokens
$
0.45
/ M Tokens
輸出
$
2.55
/ M Tokens
$
3.5
/ M Tokens
元數據
規格
州
Available
Available
架構
Mixture of Experts (MoE) with DeepSeek Sparse Attention (DSA) and asynchronous RL stack
Mixture-of-Experts
經過校準的
不
不
專家混合
是
是
總參數
750B
235B
啟用的參數
40B
22B
推理
不
不
精確
FP8
FP8
上下文長度
205K
262K
最大輸出長度
131K
262K
支援的功能
無伺服器
支持
支持
無伺服器的 LoRA
不支持
不支持
微調
不支持
不支持
嵌入
不支持
不支持
重新排名者
不支持
不支持
支援圖片輸入
不支持
不支持
JSON 模式
不支持
支持
結構化輸出
不支持
不支持
工具
支持
支持
完成最後一步
不支持
支持
聊天前綴完成
不支持
支持



