DeepSeek-R1-Distill-Qwen-7B
Tentang DeepSeek-R1-Distill-Qwen-7B
DeepSeek-R1-Distill-Qwen-7B adalah model distilasi berdasarkan Qwen2.5-Math-7B. Model ini di-tuning dengan menggunakan 800k sampel yang dikuratori yang dihasilkan oleh DeepSeek-R1 dan menunjukkan kemampuan penalaran yang kuat. Model ini mencapai hasil yang mengesankan di berbagai benchmark, termasuk akurasi 92.8% pada MATH-500, tingkat kelulusan 55.5% pada AIME 2024, dan peringkat 1189 di CodeForces, menunjukkan kemampuan matematika dan pemrograman yang luar biasa untuk model skala 7B
Jelajahi bagaimana kemampuan penalaran, matematika, dan pemrograman powerful dari DeepSeek-R1-Distill-Qwen-7B dapat diterapkan untuk menyelesaikan masalah kompleks di dunia nyata secara efisien.
Pemecahan Masalah Matematika Tingkat Lanjut
Menghadapi tantangan matematika yang rumit, dari fisika teoretis hingga teknik kompleks, dengan memanfaatkan kemampuan Model untuk menghasilkan dan memverifikasi bukti, menyelesaikan persamaan, dan menurunkan rumus.
Contoh Kasus Penggunaan:
"Seorang ilmuwan material menggunakan Model untuk menurunkan satu set baru persamaan diferensial parsial yang menggambarkan sifat termal paduan baru, mempercepat desain eksperimental secara signifikan."
Analisis & Penyempurnaan Kode Cerdas
Tingkatkan kualitas perangkat lunak dengan mengidentifikasi bug halus, mengoptimalkan algoritma, dan melakukan refaktor kode kompleks di berbagai paradigma pemrograman dengan penalaran logis yang mendalam.
Contoh Kasus Penggunaan:
"Mengoptimalkan saluran pemrosesan data kritis yang ditulis dalam Python dengan mengidentifikasi algoritma pengurutan yang tidak efisien dan menyarankan alternatif yang lebih performa dan efisien memori, mengurangi waktu eksekusi hingga 40%."
Pemodelan Keuangan Kuantitatif
Melakukan analisis kuantitatif mendalam pada data pasar dan laporan keuangan, menemukan tren, menilai risiko, dan menghasilkan strategi investasi yang didorong oleh data.
Contoh Kasus Penggunaan:
"Mengembangkan Model prediktif untuk pergerakan harga cryptocurrency dengan menganalisis data perdagangan historis dan indikator makroekonomi, memberikan rekomendasi portofolio yang disesuaikan dengan risiko secara detail."
Audit Logika & Kepatuhan Otomatis
Mengaudit secara sistematis sistem yang kompleks, dari dokumen regulasi hingga konfigurasi jaringan, untuk mendeteksi ketidakkonsistenan logis, celah kepatuhan, dan potensi kerentanan.
Contoh Kasus Penggunaan:
"Melakukan audit terhadap file konfigurasi infrastruktur cloud perusahaan besar (Terraform/YAML) untuk mengidentifikasi kesalahan konfigurasi keamanan dan pelanggaran kebijakan, memastikan kepatuhan terhadap praktik terbaik industri."
Metadata
Spesifikasi
Negara
Deprecated
Arsitektur
Qwen2.5
Terkalibrasi
Tidak
Campuran Ahli
Tidak
Total Parameter
7B
Parameter yang Diaktifkan
7B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
33K
Max Tokens
16K
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.
DeepSeek
chat
DeepSeek-V3.2
Dirilis pada: 4 Des 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Dirilis pada: 10 Okt 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Dirilis pada: 29 Sep 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Dirilis pada: 25 Agu 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Dirilis pada: 26 Des 2024
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Dirilis pada: 28 Mei 2025
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Dirilis pada: 20 Jan 2025
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
