

モデル比較
GLM-5
対
Ling-flash-2.0
2026/02/15

価格
Input
$
0.3
/ M Tokens
$
0.14
/ M Tokens
Output
$
2.55
/ M Tokens
$
0.57
/ M Tokens
メタデータ
仕様
州
Available
Available
建築
Mixture of Experts (MoE) with DeepSeek Sparse Attention (DSA) and asynchronous RL stack
Ling 2.0 MoE architecture
キャリブレートされた
いいえ
いいえ
専門家の混合
はい
はい
合計パラメータ
750B
100B
アクティブ化されたパラメータ
40B
6.1B
推論
いいえ
いいえ
Precision
FP8
FP8
コンテキスト長
205K
131K
Max Tokens
131K
131K
対応機能
Serverless
対応
対応
Serverless LoRA
サポートされていません
サポートされていません
Fine-tuning
サポートされていません
サポートされていません
Embeddings
サポートされていません
サポートされていません
Rerankers
サポートされていません
サポートされていません
Image入力をサポートする
サポートされていません
サポートされていません
JSON Mode
サポートされていません
対応
構造化されたOutputs
サポートされていません
サポートされていません
ツール
対応
対応
Fim Completion
サポートされていません
サポートされていません
Chat Prefix Completion
サポートされていません
対応



