
Perbandingan Model
DeepSeek-R1
vs
Qwen3-VL-235B-A22B-Instruct
10 Feb 2026

Harga
Input
$
0.5
/ M Tokens
$
0.3
/ M Tokens
Output
$
2.18
/ M Tokens
$
1.5
/ M Tokens
Metadata
Buat di
20 Jan 2025
22 Sep 2025
Lisensi
MIT
APACHE-2.0
Penyedia
DeepSeek
Qwen
Spesifikasi
Negara
Available
Available
Arsitektur
MoE
MoE
Terkalibrasi
Tidak
Ya
Campuran Ahli
Ya
Ya
Total Parameter
671B
235B
Parameter yang Diaktifkan
37B
22B
Penalaran
Tidak
Tidak
Precision
FP8
FP8
Text panjang konteks
164K
262K
Max Tokens
164K
262K
Didukung Keberfungsian
Serverless
didukung
didukung
Serverless LoRA
Tidak didukung
Tidak didukung
Fine-tuning
Tidak didukung
Tidak didukung
Embeddings
Tidak didukung
Tidak didukung
Rerankers
Tidak didukung
Tidak didukung
Dukung Image Input
Tidak didukung
Tidak didukung
JSON Mode
didukung
didukung
Output Terstruktur
Tidak didukung
Tidak didukung
Alat
didukung
didukung
Fim Completion
didukung
didukung
Chat Prefix Completion
didukung
didukung
DeepSeek-R1dalam Perbandingan
Lihat bagaimana DeepSeek-R1membandingkan dengan model populer lainnya di berbagai dimensi kunci.
VS

GLM-4.7
VS
DeepSeek-V3.2
VS

DeepSeek-V3.1-Nex-N1
VS

Kimi-K2-Thinking
VS

MiniMax-M2
VS
DeepSeek-V3.2-Exp
VS

GLM-4.6
VS
DeepSeek-V3.1-Terminus
VS

Qwen3-VL-235B-A22B-Instruct
VS

Qwen3-VL-235B-A22B-Thinking
VS

Kimi-K2-Instruct-0905
VS
DeepSeek-V3.1
VS

step3
VS

Qwen3-235B-A22B-Thinking-2507
VS

Qwen3-Coder-480B-A35B-Instruct
VS

Qwen3-235B-A22B-Instruct-2507
VS

Kimi-K2-Instruct
VS

Kimi-Dev-72B
VS

MiniMax-M1-80k
VS
DeepSeek-V3
