DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

關於DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B 是基於 Qwen2.5-Math-7B 的蒸餾模型。該模型使用由 DeepSeek-R1 生成的 80 萬個精選樣本進行微調,展現出強大的推理能力。在多項基準測試中取得了驚人的成績,包括在 MATH-500 上達到 92.8% 的準確率,在 AIME 2024 上達到 55.5% 的通過率,以及在 CodeForces 上獲得 1189 的評分,展現出對於一個 7B 級別模型來說卓越的數學和編程能力。

可用的無伺服器

立即運行查詢,僅按使用量付費

$

0.05

$

0.05

每百萬 Tokens(輸入/輸出)

元數據

創建於

2025年1月20日

許可證

MIT LICENSE

供應商

DeepSeek

規格

狀態

可用

架構

經過校準的

專家並行

總參數

7B

啟用的參數

7B

推理

精度

FP8

上下文長度

33K

最大輸出長度

16K

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

不支持

JSON 模式

支持

結構化輸出

不支持

工具

支持

中間填充補全

支持

聊天前綴補全

不支持

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow