

Perbandingan Model
GLM-4.6V
vs
step3
28 Feb 2026

Harga
Input
$
0.3
/ M Tokens
$
0.57
/ M Tokens
Output
$
0.9
/ M Tokens
$
1.42
/ M Tokens
Metadata
Spesifikasi
Negara
Available
Deprecated
Arsitektur
Multimodal with Function Calling, Mixture of Experts (MoE)
Mixture-of-Experts (MoE) architecture with Multi-Matrix Factorization Attention (MFA) and Attention-FFN Disaggregation (AFD)
Terkalibrasi
Ya
Tidak
Campuran Ahli
Ya
Ya
Total Parameter
106B
321B
Parameter yang Diaktifkan
106B
38B
Penalaran
Tidak
Tidak
Precision
FP8
FP8
Text panjang konteks
131K
66K
Max Tokens
131K
66K
Didukung Keberfungsian
Serverless
didukung
didukung
Serverless LoRA
Tidak didukung
Tidak didukung
Fine-tuning
Tidak didukung
Tidak didukung
Embeddings
Tidak didukung
Tidak didukung
Rerankers
Tidak didukung
Tidak didukung
Dukung Image Input
Tidak didukung
Tidak didukung
JSON Mode
Tidak didukung
didukung
Output Terstruktur
Tidak didukung
Tidak didukung
Alat
didukung
didukung
Fim Completion
Tidak didukung
Tidak didukung
Chat Prefix Completion
Tidak didukung
Tidak didukung
GLM-4.6Vdalam Perbandingan
Lihat bagaimana GLM-4.6Vmembandingkan dengan model populer lainnya di berbagai dimensi kunci.
VS

MiniMax-M2.5
VS

GLM-5
VS

Step-3.5-Flash
VS

GLM-4.7
VS

MiniMax-M2.1
VS

MiniMax-M2
VS

Qwen3-VL-32B-Instruct
VS

Qwen3-VL-32B-Thinking
VS

Qwen3-VL-30B-A3B-Instruct
VS

Qwen3-VL-30B-A3B-Thinking
VS

Qwen3-VL-235B-A22B-Instruct
VS

Qwen3-VL-235B-A22B-Thinking
VS

Qwen3-Omni-30B-A3B-Instruct
VS

Ring-flash-2.0
VS

Ling-flash-2.0
VS

Qwen3-Omni-30B-A3B-Captioner
VS

Qwen3-Omni-30B-A3B-Thinking
VS

Qwen3-Next-80B-A3B-Instruct
VS

Qwen3-Next-80B-A3B-Thinking
VS
gpt-oss-120b
