

モデル比較
GLM-4.1V-9B-Thinking
対
Qwen2.5-VL-72B-Instruct
2026/02/04

価格
Input
$
0.035
/ M Tokens
$
0.59
/ M Tokens
Output
$
0.14
/ M Tokens
$
0.59
/ M Tokens
メタデータ
仕様
州
Deprecated
Available
建築
Vision-Language Model (VLM) based on GLM-4-9B-0414 with thinking paradigm
Vision-Language Model (VLM) with a Streamlined and Efficient Vision Encoder (ViT with window attention, SwiGLU, RMSNorm) aligned with the Qwen2.5 LLM structure. Features include Dynamic Resolution and Frame Rate Training for video understanding, mRoPE for temporal sequence and speed, and YaRN for long text context length extrapolation.
キャリブレートされた
いいえ
いいえ
専門家の混合
いいえ
いいえ
合計パラメータ
9B
72B
アクティブ化されたパラメータ
9B
72B
推論
いいえ
いいえ
Precision
FP8
FP8
コンテキスト長
66K
131K
Max Tokens
66K
4K
対応機能
Serverless
対応
対応
Serverless LoRA
サポートされていません
サポートされていません
Fine-tuning
サポートされていません
サポートされていません
Embeddings
サポートされていません
サポートされていません
Rerankers
サポートされていません
サポートされていません
Image入力をサポートする
サポートされていません
サポートされていません
JSON Mode
サポートされていません
サポートされていません
構造化されたOutputs
サポートされていません
サポートされていません
ツール
サポートされていません
サポートされていません
Fim Completion
サポートされていません
サポートされていません
Chat Prefix Completion
サポートされていません
対応
GLM-4.1V-9B-Thinking比較において
見てくださいGLM-4.1V-9B-Thinking主要な次元において他の人気のあるモデルと比較します。
VS

Qwen3-VL-32B-Instruct
VS

Qwen3-VL-32B-Thinking
VS

Qwen3-VL-8B-Instruct
VS

Qwen3-VL-8B-Thinking
VS

Qwen3-VL-30B-A3B-Instruct
VS

Qwen3-VL-30B-A3B-Thinking
VS

Qwen3-Omni-30B-A3B-Instruct
VS

Qwen3-Omni-30B-A3B-Captioner
VS

Qwen3-Omni-30B-A3B-Thinking
VS

Qwen3-Next-80B-A3B-Instruct
VS

Qwen3-Next-80B-A3B-Thinking
VS

Ling-mini-2.0
VS

Hunyuan-MT-7B
VS
gpt-oss-20b
VS

Qwen3-Coder-30B-A3B-Instruct
VS

Qwen3-30B-A3B-Thinking-2507
VS

Qwen3-30B-A3B-Instruct-2507
VS

Hunyuan-A13B-Instruct
VS

Qwen3-14B
VS

Qwen3-30B-A3B
