GLM-5
Tentang GLM-5
GLM-5 is a next-generation open-source model for complex systems engineering and long-horizon agentic tasks, scaled to ~744B sparse parameters (~40B active) with ~28.5T pretraining tokens. It integrates DeepSeek Sparse Attention (DSA) to retain long-context capacity while reducing inference cost, and leverages the “slime” asynchronous RL stack to deliver strong performance in reasoning, coding, and agentic benchmarks.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
1.0
/
$
3.2
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Mixture of Experts (MoE) with DeepSeek Sparse Attention (DSA) and asynchronous RL stack
Terkalibrasi
Tidak
Campuran Ahli
Ya
Total Parameter
750B
Parameter yang Diaktifkan
40B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
205K
Max Tokens
131K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
Tidak didukung
Output Terstruktur
Tidak didukung
Alat
didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
Tidak didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

Z.ai
chat
GLM-5
Dirilis pada: 12 Feb 2026
Total Context:
205K
Max output:
131K
Input:
$
1.0
/ M Tokens
Output:
$
3.2
/ M Tokens

Z.ai
chat
GLM-4.7
Dirilis pada: 23 Des 2025
Total Context:
205K
Max output:
205K
Input:
$
0.42
/ M Tokens
Output:
$
2.2
/ M Tokens

Z.ai
chat
GLM-4.6V
Dirilis pada: 8 Des 2025
Total Context:
131K
Max output:
131K
Input:
$
0.3
/ M Tokens
Output:
$
0.9
/ M Tokens

Z.ai
chat
GLM-4.6
Dirilis pada: 4 Okt 2025
Total Context:
205K
Max output:
205K
Input:
$
0.39
/ M Tokens
Output:
$
1.9
/ M Tokens

Z.ai
chat
GLM-4.5-Air
Dirilis pada: 28 Jul 2025
Total Context:
131K
Max output:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.5V
Dirilis pada: 13 Agu 2025
Total Context:
66K
Max output:
66K
Input:
$
0.14
/ M Tokens
Output:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.1V-9B-Thinking
Dirilis pada: 4 Jul 2025
Total Context:
66K
Max output:
66K
Input:
$
0.035
/ M Tokens
Output:
$
0.14
/ M Tokens

Z.ai
chat
GLM-Z1-32B-0414
Dirilis pada: 18 Apr 2025
Total Context:
131K
Max output:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

Z.ai
chat
GLM-4-32B-0414
Dirilis pada: 18 Apr 2025
Total Context:
33K
Max output:
33K
Input:
$
0.27
/ M Tokens
Output:
$
0.27
/ M Tokens
