关于Kimi-Dev-72B
Kimi-Dev-72B 是一个新的开源编码大型语言模型,在 SWE-bench Verified 上取得了 60.4% 的成绩,创造了开源模型中最先进的成果。通过大规模强化学习进行优化,它在 Docker 中自主修补真实代码库,仅在完整测试套件通过时获得奖励。这确保了模型能够提供正确、可靠、且符合实际软件工程标准的实用解决方案。
探索 Kimi-Dev-72B 的尖端编码能力如何自主解决复杂的软件工程挑战。
自动化软件补丁
Kimi-Dev-72B 自主识别并应用现实世界中的软件问题修复,确保所有补丁在 Docker 化环境中通过所有测试套件。
使用案例示例:
"自动解决了一个 Python 网络框架身份验证模块的关键错误,生成了一个通过 100% 单元和集成测试的强健补丁。"
高级代码调试与优化
精确定位微妙的逻辑错误,并建议在大型代码库中进行性能增强,确保通过全面的测试套件验证。
使用案例示例:
"优化了一个 Java 微服务的数据库查询逻辑,降低了 30% 的延迟,并确保所有现有的集成测试继续通过。"
测试驱动的功能开发
通过生成本质上健壮的新代码功能来加速开发,因为这些功能被设计为通过预定义或生成的测试用例。
使用案例示例:
"在 Go 中开发了一个新的数据处理管道功能,生成了实现和相应的单元测试,确保了即时的功能正确性。"
遗留代码重构与现代化
将过时的代码库转变为现代可维护系统,确保在重构过程中功能等价和测试套件的兼容性。
使用案例示例:
"将遗留的 C# 桌面应用程序重构为使用现代 .NET 异步模式,通过确保所有原始 UI 和后端测试通过来验证功能完整性。"
元数据
规格
州
Deprecated
建筑
校准的
是
专家混合
不
总参数
1000B
激活的参数
1000B
推理
不
精度
FP8
上下文长度
131K
最大输出长度
131K
与其他模型进行比较
看看这个模型与其他模型相比表现如何。

Moonshot AI
chat
Kimi-K2.5
发行日期:2026年1月30日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.23
/ M Tokens
Output:
$
3.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Thinking
发行日期:2025年11月7日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.55
/ M Tokens
Output:
$
2.5
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct-0905
发行日期:2025年9月8日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.4
/ M Tokens
Output:
$
2
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct
发行日期:2025年7月13日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.58
/ M Tokens
Output:
$
2.29
/ M Tokens

Moonshot AI
chat
Kimi-Dev-72B
发行日期:2025年6月19日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.29
/ M Tokens
Output:
$
1.15
/ M Tokens
