
Perbandingan Model
DeepSeek-R1-Distill-Qwen-32B
vs
deepseek-vl2
10 Feb 2026
Harga
Input
$
0.18
/ M Tokens
$
0.15
/ M Tokens
Output
$
0.18
/ M Tokens
$
0.15
/ M Tokens
Metadata
Buat di
20 Jan 2025
13 Des 2024
Lisensi
MIT LICENSE
DEEPSEEK MODEL LICENSE
Penyedia
DeepSeek
DeepSeek
Spesifikasi
Negara
Available
Deprecated
Arsitektur
Dense Transformer
Sparse MoE VLM
Terkalibrasi
Tidak
Tidak
Campuran Ahli
Tidak
Ya
Total Parameter
32B
27B
Parameter yang Diaktifkan
32B
4.5B
Penalaran
Tidak
Tidak
Precision
FP8
FP8
Text panjang konteks
131K
4K
Max Tokens
131K
4K
Didukung Keberfungsian
Serverless
didukung
didukung
Serverless LoRA
Tidak didukung
Tidak didukung
Fine-tuning
Tidak didukung
Tidak didukung
Embeddings
Tidak didukung
Tidak didukung
Rerankers
Tidak didukung
Tidak didukung
Dukung Image Input
Tidak didukung
Tidak didukung
JSON Mode
didukung
didukung
Output Terstruktur
Tidak didukung
Tidak didukung
Alat
didukung
Tidak didukung
Fim Completion
didukung
Tidak didukung
Chat Prefix Completion
Tidak didukung
didukung
DeepSeek-R1-Distill-Qwen-32Bdalam Perbandingan
Lihat bagaimana DeepSeek-R1-Distill-Qwen-32Bmembandingkan dengan model populer lainnya di berbagai dimensi kunci.
VS

GLM-4.6V
VS

Qwen3-VL-32B-Instruct
VS

Qwen3-VL-32B-Thinking
VS

Qwen3-VL-8B-Instruct
VS

Qwen3-VL-8B-Thinking
VS

Qwen3-VL-30B-A3B-Instruct
VS

Qwen3-VL-30B-A3B-Thinking
VS

Qwen3-Omni-30B-A3B-Instruct
VS

Ring-flash-2.0
VS

Ling-flash-2.0
VS

Qwen3-Omni-30B-A3B-Captioner
VS

Qwen3-Omni-30B-A3B-Thinking
VS

Qwen3-Next-80B-A3B-Instruct
VS

Qwen3-Next-80B-A3B-Thinking
VS

Ling-mini-2.0
VS

Hunyuan-MT-7B
VS
gpt-oss-120b
VS
gpt-oss-20b
VS

Qwen3-Coder-30B-A3B-Instruct
VS

Qwen3-30B-A3B-Thinking-2507
