約Kimi-Dev-72B
Kimi-Dev-72Bは、オープンソースのコーディング用大規模言語Modelで、SWE-bench Verifiedで60.4%を達成し、オープンソースModelの中で最先端の結果を設定しています。大規模な強化学習を通じて最適化され、Docker内の実際のコードベースを自律的に修正し、完全なテストスイートが合格したときのみ報酬を得ます。これにより、Modelが実際のソフトウェア工学の基準に沿った正確で堅牢かつ実用的なソリューションを提供することが保証されます。
Kimi-Dev-72Bの最先端コーディング能力が、複雑なソフトウェア工学の課題を自律的に解決する方法を探ります。
自動ソフトウェアパッチ適用
Kimi-Dev-72Bは、実際のソフトウェアの問題を自律的に特定および修正し、Docker化された環境で全てのテストスイートを通過することを保証します。
ユースケースの例:
"Pythonのウェブフレームワークの認証モジュールの重要なバグを自動的に解決し、100%のユニットおよび統合テストを通過する堅牢なパッチを生成しました。"
高度なコードデバッグと最適化
微妙な論理エラーを特定し、大規模なコードベース全体でパフォーマンスの改善を提案します。これらは包括的なテストスイートを通過することで検証されます。
ユースケースの例:
"Javaのマイクロサービスのデータベースクエリロジックを最適化し、レイテンシを30%削減し、すべての既存の統合テストが通過することを保証しました。"
テスト駆動型機能開発
事前に定義されたまたは生成されたテストケースに合格するように設計された新しいコード機能を生成することで、開発を加速します。
ユースケースの例:
"Goで新しいデータ処理パイプライン機能を開発し、実装と対応するユニットテストを生成し、即座の機能的正当性を保証しました。"
レガシーコードのリファクタリングとモダニゼーション
古いコードベースを現代の保守可能なシステムに変換し、リファクタリングプロセス全体で機能的等価性とテストスイートの互換性を確保します。
ユースケースの例:
"レガシーC#デスクトップアプリケーションを現代の.NET非同期パターンを使用するようにリファクタリングし、すべての元のUIおよびバックエンドテストが通過することを確認することで機能の整合性を検証しました。"
メタデータ
仕様
州
Deprecated
建築
Qwen2
キャリブレートされた
はい
専門家の混合
いいえ
合計パラメータ
1000B
アクティブ化されたパラメータ
1000B
推論
いいえ
Precision
FP8
コンテキスト長
131K
Max Tokens
131K
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。

Moonshot AI
chat
Kimi-K2.5
リリース日:2026/01/30
Total Context:
262K
Max output:
262K
Input:
$
0.55
/ M Tokens
Output:
$
3.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Thinking
リリース日:2025/11/07
Total Context:
262K
Max output:
262K
Input:
$
0.55
/ M Tokens
Output:
$
2.5
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct-0905
リリース日:2025/09/08
Total Context:
262K
Max output:
262K
Input:
$
0.4
/ M Tokens
Output:
$
2.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct
リリース日:2025/07/13
Total Context:
131K
Max output:
131K
Input:
$
0.58
/ M Tokens
Output:
$
2.29
/ M Tokens

Moonshot AI
chat
Kimi-Dev-72B
リリース日:2025/06/19
Total Context:
131K
Max output:
131K
Input:
$
0.29
/ M Tokens
Output:
$
1.15
/ M Tokens
