約DeepSeek-R1-Distill-Qwen-7B
DeepSeek-R1-Distill-Qwen-7Bは、Qwen2.5-Math-7Bに基づいた蒸留モデルです。このモデルは、DeepSeek-R1によって生成された80万の精選されたサンプルを使用してファインチューニングされ、強力な推論能力を示しています。MATH-500では92.8%の正確性、AIME 2024では55.5%の合格率、CodeForcesでは1189の評価を達成し、7Bスケールモデルとして卓越した数学的およびプログラミングの能力を示しています。
DeepSeek-R1-Distill-Qwen-7Bの強力な推論、数学、プログラミング能力が、複雑な現実世界の問題を効率的に解決するためにどのように応用できるかを探る。
高等数学問題解決
モデルの証明生成と検証、方程式の解決、公式の導出能力を活用して、理論物理学から複雑な工学までの精巧な数学的課題に取り組む。
ユースケース例:
"材料科学者がモデルを使用して、新しい合金の熱特性を記述する部分微分方程式の新しいセットを導き出し、実験設計を大幅に加速した。"
インテリジェントコード解析と改良
深い論理的推論を用いて微細なバグを特定し、アルゴリズムを最適化し、さまざまなプログラミングパラダイムにわたって複雑なコードをリファクタリングすることでソフトウェア品質を向上させる。
ユースケース例:
"Pythonで書かれた重要なデータ処理パイプラインを最適化するために、非効率なソートアルゴリズムを特定し、より性能が高くメモリー効率の高い代替案を提案し、実行時間を40%削減した。"
定量的金融モデル
市場データと財務報告書に関する詳細な定量分析を行い、トレンドを見つけ出し、リスクを評価し、データ駆動型の投資戦略を生成する。
ユースケース例:
"歴史的な取引データとマクロ経済指標を分析することで、仮想通貨の価格動向に関する予測モデルを開発し、詳細なリスク調整ポートフォリオの推奨を提供した。"
自動ロジックとコンプライアンス監査
論理的不整合、コンプライアンスギャップ、潜在的な脆弱性を検出するために、規制文書からネットワーク設定までの複雑なシステムを体系的に監査する。
ユースケース例:
"大規模企業のクラウドインフラストラクチャ構成ファイル(Terraform/YAML)を監査し、セキュリティの誤構成とポリシー違反を特定し、業界のベストプラクティスに準拠することを保証した。"
メタデータ
仕様
州
Deprecated
建築
キャリブレートされた
いいえ
専門家の混合
いいえ
合計パラメータ
7B
アクティブ化されたパラメータ
7B
推論
いいえ
Precision
FP8
コンテキスト長
33K
Max Tokens
16K
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。
DeepSeek
chat
DeepSeek-V3.2
リリース日:2025/12/04
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
リリース日:2025/10/10
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
リリース日:2025/09/29
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
リリース日:2025/08/25
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3
リリース日:2024/12/26
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-R1
リリース日:2025/05/28
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
リリース日:2025/01/20
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
リリース日:2025/01/20
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
リリース日:2025/01/20
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
