DeepSeek-R1-Distill-Qwen-32B
Tentang DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Qwen-32B adalah model distilled berdasarkan Qwen2.5-32B. Model ini telah di-tuning ulang menggunakan 800k sampel terkurasi yang dihasilkan oleh DeepSeek-R1 dan menunjukkan kinerja yang luar biasa di berbagai tugas matematika, pemrograman, dan logika. Model ini mencapai hasil yang mengesankan dalam berbagai tolok ukur termasuk AIME 2024, MATH-500, dan GPQA Diamond, dengan akurasi yang menonjol sebesar 94,3% pada MATH-500, menunjukkan kemampuan penalaran matematis yang kuat.
Jelajahi bagaimana kemampuan penalaran, matematika, dan pemrograman yang luar biasa dari DeepSeek-R1-Distill-Qwen-32B dapat menyelesaikan masalah kompleks dunia nyata.
Pemecahan Masalah Ilmiah Lanjutan
Manfaatkan kemampuan matematika dan penalaran superior DeepSeek-R1-Distill-Qwen-32B untuk menangani tantangan ilmiah kompleks, mulai dari fisika teoretis hingga pemodelan biokimia.
Contoh Kasus Penggunaan:
"Membantu tim komputasi kuantum dengan mengembangkan algoritma baru untuk koreksi kesalahan, secara signifikan mempercepat garis waktu penelitian mereka."
Analisis & Penyempurnaan Kode Multi-Bahasa
Melampaui debugging dasar. Menganalisis basis kode besar di berbagai bahasa untuk mengidentifikasi kekurangan logis yang halus, mengoptimalkan algoritma, dan meningkatkan keamanan sistem.
Contoh Kasus Penggunaan:
"Mengidentifikasi kondisi balapan kritis pada aplikasi blockchain berbasis Rust dengan melacak jalur eksekusi bersamaan, memberikan perbaikan yang tepat dan aman."
Strategi Keuangan Kuantitatif
Melakukan analisis kuantitatif mendalam pada dataset keuangan yang luas, mengidentifikasi pola pasar yang rumit, dan merumuskan strategi perdagangan atau investasi algoritmik yang kuat.
Contoh Kasus Penggunaan:
"Mengembangkan algoritma perdagangan frekuensi tinggi dengan menganalisis data pasar historis dan indikator ekonomi, melampaui Model tradisional sebesar 15%."
Audit Sistem Cerdas & Kepatuhan
Mengotomatisasi pengauditan sistem yang kompleks, dari dokumen regulasi hingga desain teknik yang rumit, memastikan kepatuhan dan mengidentifikasi kerentanan kritis.
Contoh Kasus Penggunaan:
"Mengaudit konfigurasi infrastruktur cloud berskala besar untuk kepatuhan dengan GDPR dan SOC 2, menandai beberapa kesalahan konfigurasi dan menyarankan langkah-langkah perbaikan."
Metadata
Spesifikasi
Negara
Deprecated
Arsitektur
Dense Transformer
Terkalibrasi
Tidak
Campuran Ahli
Tidak
Total Parameter
32B
Parameter yang Diaktifkan
32B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
131K
Max Tokens
131K
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.
DeepSeek
chat
DeepSeek-V3.2
Dirilis pada: 4 Des 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Dirilis pada: 10 Okt 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Dirilis pada: 29 Sep 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Dirilis pada: 25 Agu 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Dirilis pada: 26 Des 2024
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Dirilis pada: 28 Mei 2025
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Dirilis pada: 20 Jan 2025
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
