

模型比較
GLM-5
對比
2026年2月15日
定價
輸入
$
0.3
/ M Tokens
$
/ M Tokens
輸出
$
2.55
/ M Tokens
$
/ M Tokens
元數據
規格
州
Available
架構
Mixture of Experts (MoE) with DeepSeek Sparse Attention (DSA) and asynchronous RL stack
經過校準的
不
是
專家混合
是
是
總參數
750B
啟用的參數
40B
推理
不
是
精確
FP8
上下文長度
205K
最大輸出長度
131K
支援的功能
無伺服器
支持
支持
無伺服器的 LoRA
不支持
支持
微調
不支持
支持
嵌入
不支持
不支持
重新排名者
不支持
支持
支援圖片輸入
不支持
不支持
JSON 模式
不支持
支持
結構化輸出
不支持
支持
工具
支持
支持
完成最後一步
不支持
支持
聊天前綴完成
不支持
支持




