關於Kimi-Dev-72B
Kimi-Dev-72B 是一個新的開源編碼大型語言模型,在 SWE-bench Verified 上實現了 60.4%,在開源模型中設定了最先進的結果。通過大規模強化學習優化,它能自主修補 Docker 中的實際代碼庫,僅在完整測試套件通過時獲得獎勵。這確保了模型能提供正確、穩健和實用的解決方案,以符合現實世界的軟體工程標準。
探索 Kimi-Dev-72B 的尖端編程能力如何自主解決複雜的軟體工程挑戰。
自動化軟體修補
Kimi-Dev-72B 自主識別並應用針對現實世界軟體問題的修復,確保修補在 Docker 化環境中通過所有測試套件。
使用案例示例:
"自動解決了 Python 網頁框架驗證模組中的一個關鍵錯誤,生成了通過 100% 單元與整合測試的健全修補程式。"
高級代碼調試與優化
精確定位微妙的邏輯錯誤並在大型程式碼庫中建議性能增強,通過通過全面的測試套件進行驗證。
使用案例示例:
"優化了一個 Java 微服務的資料庫查詢邏輯,將延遲減少 30%,並確保所有現有的整合測試持續通過。"
以測試驅動的功能開發
通過生成內在強健的新代碼功能來加速開發,這些功能旨在通過預定義或生成的測試案例。
使用案例示例:
"在 Go 中開發了一個新的資料處理管道功能,生成實現和對應的單元測試,確保立即的功能正確性。"
舊代碼重構與現代化
將過時的程式碼庫轉換為現代可維護的系統,確保在重構過程中功能等效並與測試套件兼容。
使用案例示例:
"重構了一個舊的 C# 桌面應用程式,以使用現代 .NET 異步模式,通過確保所有原始 UI 和後端測試通過來驗證功能的完整性。"
元數據
規格
狀態
Deprecated
架構
Qwen2
經過校準的
是
專家並行
否
總參數
1000B
啟用的參數
1000B
推理
否
精度
FP8
上下文長度
131K
最大輸出長度
131K
與其他模型比較
看看這個模型與其他模型的對比如何。

Moonshot AI
chat
Kimi-K2.5
發行日期:2026年1月30日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.23
/ M Tokens
輸出:
$
3.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Thinking
發行日期:2025年11月7日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.55
/ M Tokens
輸出:
$
2.5
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct-0905
發行日期:2025年9月8日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.4
/ M Tokens
輸出:
$
2.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct
發行日期:2025年7月13日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.58
/ M Tokens
輸出:
$
2.29
/ M Tokens

Moonshot AI
chat
Kimi-Dev-72B
發行日期:2025年6月19日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.29
/ M Tokens
輸出:
$
1.15
/ M Tokens
