DeepSeek-R1-Distill-Qwen-14B
Tentang DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-14B adalah model distilasi berdasarkan Qwen2.5-14B. Model ini disesuaikan menggunakan 800k sampel terkurasi yang dihasilkan oleh DeepSeek-R1 dan menunjukkan kemampuan penalaran yang kuat. Ini mencapai hasil yang mengesankan di berbagai tolok ukur, termasuk akurasi 93,9% pada MATH-500, tingkat kelulusan 69,7% pada AIME 2024, dan peringkat 1481 di CodeForces, menunjukkan kemampuannya yang kuat dalam tugas matematika dan pemrograman.
Jelajahi bagaimana alasan kuat dan terdistilasi dari DeepSeek-R1-Distill-Qwen-14B dapat diterapkan untuk menyelesaikan masalah dunia nyata yang kompleks dengan efisiensi dan Precision.
Pemodelan Matematika & Fisika Lanjutan
Manfaatkan DeepSeek-R1-Distill-Qwen-14B untuk derivasi matematika yang rumit, simulasi fisika kompleks, dan pembangkitan bukti yang ketat, mempercepat terobosan ilmiah dan rekayasa.
Contoh Kasus Penggunaan:
"Membantu seorang insinyur dirgantara dalam menyusun persamaan lintasan optimal untuk peluncuran satelit, mengurangi waktu perhitungan manual sebesar 70% dan meningkatkan akurasi Model."
Analisis & Refactoring Kode Precision
Analisis basis kode besar untuk mengidentifikasi kekurangan logis halus, mengoptimalkan algoritma, dan menyarankan strategi refactoring yang kuat di berbagai bahasa pemrograman.
Contoh Kasus Penggunaan:
"Mengidentifikasi dan mengusulkan struktur data yang lebih efisien untuk microservice Go yang penting, mengurangi latensi sebesar 15% dan meningkatkan pemanfaatan sumber daya."
Pengembangan Strategi Trading Algoritmik
Merancang dan menguji ulang strategi trading algoritmik canggih dengan menganalisis data pasar, mengidentifikasi pola kompleks, dan menyimpulkan hubungan sebab-akibat untuk keputusan investasi yang optimal.
Contoh Kasus Penggunaan:
"Mengembangkan algoritma trading frekuensi tinggi untuk pasar kripto, memprediksi pergerakan harga dengan akurasi yang lebih baik dengan mengidentifikasi korelasi antar aset yang halus."
Penilaian Kerentanan Sistem Cerdas
Audit otomatis sistem perangkat lunak yang kompleks, smart contract, atau konfigurasi jaringan untuk mendeteksi kerentanan logis, cacat keamanan, dan deviasi kepatuhan melalui pemikiran mendalam.
Contoh Kasus Penggunaan:
"Mengungkap kerentanan reentrancy yang kritis dalam smart contract Solidity dengan menelusuri aliran transaksi secara teliti, mencegah potensi kehilangan aset dalam protokol DeFi."
Metadata
Spesifikasi
Negara
Deprecated
Arsitektur
Terkalibrasi
Tidak
Campuran Ahli
Tidak
Total Parameter
14B
Parameter yang Diaktifkan
14B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
131K
Max Tokens
131K
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.
DeepSeek
chat
DeepSeek-V3.2
Dirilis pada: 4 Des 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Dirilis pada: 10 Okt 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Dirilis pada: 29 Sep 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Dirilis pada: 25 Agu 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Dirilis pada: 26 Des 2024
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Dirilis pada: 28 Mei 2025
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Dirilis pada: 20 Jan 2025
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
