DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

Tentang DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B adalah model distilasi berdasarkan Qwen2.5-Math-7B. Model ini di-tuning dengan menggunakan 800k sampel yang dikuratori yang dihasilkan oleh DeepSeek-R1 dan menunjukkan kemampuan penalaran yang kuat. Model ini mencapai hasil yang mengesankan di berbagai benchmark, termasuk akurasi 92.8% pada MATH-500, tingkat kelulusan 55.5% pada AIME 2024, dan peringkat 1189 di CodeForces, menunjukkan kemampuan matematika dan pemrograman yang luar biasa untuk model skala 7B

Tersedia Serverless

Jalankan kueri segera, bayar hanya untuk penggunaan

$

0.05

/

$

0.05

Per 1M Token (Input/Output)

Metadata

Buat di

20 Jan 2025

Lisensi

MIT LICENSE

Penyedia

DeepSeek

Spesifikasi

Negara

Available

Arsitektur

Terkalibrasi

Tidak

Campuran Ahli

Tidak

Total Parameter

7B

Parameter yang Diaktifkan

7B

Penalaran

Tidak

Precision

FP8

Text panjang konteks

33K

Max Tokens

16K

Didukung Keberfungsian

Serverless

didukung

Serverless LoRA

Tidak didukung

Fine-tuning

Tidak didukung

Embeddings

Tidak didukung

Rerankers

Tidak didukung

Dukung Image Input

Tidak didukung

JSON Mode

didukung

Output Terstruktur

Tidak didukung

Alat

didukung

Fim Completion

didukung

Chat Prefix Completion

Tidak didukung

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow