

Perbandingan Model
GLM-4.1V-9B-Thinking
vs
Qwen3-Next-80B-A3B-Instruct
28 Feb 2026

Harga
Input
$
0.035
/ M Tokens
$
0.14
/ M Tokens
Output
$
0.14
/ M Tokens
$
1.4
/ M Tokens
Metadata
Buat di
28 Jun 2025
9 Sep 2025
Lisensi
MIT
APACHE-2.0
Penyedia
Z.ai
Qwen
Spesifikasi
Negara
Deprecated
Available
Arsitektur
Vision-Language Model (VLM) based on GLM-4-9B-0414 with thinking paradigm
Qwen3-Next architecture featuring Hybrid Attention (Gated DeltaNet and Gated Attention), High-Sparsity Mixture-of-Experts (MoE), Stability Optimizations, and Multi-Token Prediction (MTP)
Terkalibrasi
Tidak
Tidak
Campuran Ahli
Tidak
Ya
Total Parameter
9B
80B
Parameter yang Diaktifkan
9B
3B
Penalaran
Tidak
Tidak
Precision
FP8
FP8
Text panjang konteks
66K
262K
Max Tokens
66K
262K
Didukung Keberfungsian
Serverless
didukung
didukung
Serverless LoRA
Tidak didukung
Tidak didukung
Fine-tuning
Tidak didukung
Tidak didukung
Embeddings
Tidak didukung
Tidak didukung
Rerankers
Tidak didukung
Tidak didukung
Dukung Image Input
Tidak didukung
Tidak didukung
JSON Mode
Tidak didukung
didukung
Output Terstruktur
Tidak didukung
Tidak didukung
Alat
Tidak didukung
didukung
Fim Completion
Tidak didukung
Tidak didukung
Chat Prefix Completion
Tidak didukung
didukung
GLM-4.1V-9B-Thinkingdalam Perbandingan
Lihat bagaimana GLM-4.1V-9B-Thinkingmembandingkan dengan model populer lainnya di berbagai dimensi kunci.
VS

Qwen3-VL-32B-Instruct
VS

Qwen3-VL-32B-Thinking
VS

Qwen3-VL-8B-Instruct
VS

Qwen3-VL-8B-Thinking
VS

Qwen3-VL-30B-A3B-Instruct
VS

Qwen3-VL-30B-A3B-Thinking
VS

Qwen3-Omni-30B-A3B-Instruct
VS

Qwen3-Omni-30B-A3B-Captioner
VS

Qwen3-Omni-30B-A3B-Thinking
VS

Qwen3-Next-80B-A3B-Instruct
VS

Qwen3-Next-80B-A3B-Thinking
VS

Ling-mini-2.0
VS

Hunyuan-MT-7B
VS
gpt-oss-20b
VS

Qwen3-Coder-30B-A3B-Instruct
VS

Qwen3-30B-A3B-Thinking-2507
VS

Qwen3-30B-A3B-Instruct-2507
VS

Hunyuan-A13B-Instruct
VS

Qwen3-14B
VS

Qwen3-30B-A3B
