DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B

deepseek-ai/DeepSeek-R1-Distill-Qwen-32B

約DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32BはQwen2.5-32Bに基づいて蒸留されたModelです。ModelはDeepSeek-R1によって生成された80万の選別されたサンプルを使用してファインチューニングされ、数学、プログラミング、推論タスクにおいて卓越したパフォーマンスを示します。AIME 2024、MATH-500、GPQA Diamondを含む様々なベンチマークで印象的な結果を達成し、MATH-500では94.3%の正確性を達成し、その強力な数学的推論能力を示しています。

利用可能な Serverless

クエリをすぐに実行し、使用量のみを支払います

$

0.18

$

0.18

100万トークン(Input/Output)ごとに

メタデータ

作成する

2025/01/20

ライセンス

MIT LICENSE

プロバイダー

DeepSeek

ハギングフェイス

仕様

Available

建築

キャリブレートされた

いいえ

専門家の混合

いいえ

合計パラメータ

32B

アクティブ化されたパラメータ

32B

推論

いいえ

Precision

FP8

コンテキスト長

131K

Max Tokens

131K

対応機能

Serverless

対応

Serverless LoRA

サポートされていません

Fine-tuning

サポートされていません

Embeddings

サポートされていません

Rerankers

サポートされていません

Image入力をサポートする

サポートされていません

JSON Mode

対応

構造化されたOutputs

サポートされていません

ツール

対応

Fim Completion

対応

Chat Prefix Completion

サポートされていません

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow