DeepSeek-R1-Distill-Qwen-14B
Tentang DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-14B adalah model distilasi berdasarkan Qwen2.5-14B. Model ini disesuaikan menggunakan 800k sampel terkurasi yang dihasilkan oleh DeepSeek-R1 dan menunjukkan kemampuan penalaran yang kuat. Ini mencapai hasil yang mengesankan di berbagai tolok ukur, termasuk akurasi 93,9% pada MATH-500, tingkat kelulusan 69,7% pada AIME 2024, dan peringkat 1481 di CodeForces, menunjukkan kemampuannya yang kuat dalam tugas matematika dan pemrograman.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.1
/
$
0.1
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Tidak
Campuran Ahli
Tidak
Total Parameter
14B
Parameter yang Diaktifkan
14B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
131K
Max Tokens
131K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
didukung
Output Terstruktur
Tidak didukung
Alat
didukung
Fim Completion
didukung
Chat Prefix Completion
Tidak didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.
DeepSeek
chat
DeepSeek-V3.2
Dirilis pada: 4 Des 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Dirilis pada: 10 Okt 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Dirilis pada: 29 Sep 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Dirilis pada: 25 Agu 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Dirilis pada: 26 Des 2024
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Dirilis pada: 28 Mei 2025
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Dirilis pada: 20 Jan 2025
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
