DeepSeek-R1-Distill-Qwen-32B
Tentang DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Qwen-32B adalah model distilled berdasarkan Qwen2.5-32B. Model ini telah di-tuning ulang menggunakan 800k sampel terkurasi yang dihasilkan oleh DeepSeek-R1 dan menunjukkan kinerja yang luar biasa di berbagai tugas matematika, pemrograman, dan logika. Model ini mencapai hasil yang mengesankan dalam berbagai tolok ukur termasuk AIME 2024, MATH-500, dan GPQA Diamond, dengan akurasi yang menonjol sebesar 94,3% pada MATH-500, menunjukkan kemampuan penalaran matematis yang kuat.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.18
/
$
0.18
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Tidak
Campuran Ahli
Tidak
Total Parameter
32B
Parameter yang Diaktifkan
32B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
131K
Max Tokens
131K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
didukung
Output Terstruktur
Tidak didukung
Alat
didukung
Fim Completion
didukung
Chat Prefix Completion
Tidak didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.
DeepSeek
chat
DeepSeek-V3.2
Dirilis pada: 4 Des 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Dirilis pada: 10 Okt 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Dirilis pada: 29 Sep 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Dirilis pada: 25 Agu 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Dirilis pada: 26 Des 2024
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Dirilis pada: 28 Mei 2025
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Dirilis pada: 20 Jan 2025
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
