關於Kimi-K2-Thinking
Kimi K2 思考是最新和最有能力的開源思考模型版本。從 Kimi K2 開始,我們將其構建為一個逐步推理並動態調用工具的思考代理。它通過顯著提升多步推理深度和在 200-300 次連續調用中保持穩定的工具使用,在人類最後考試(HLE)、BrowseComp 和其他基準測試上創造了新的最先進水平。與此同時,K2 思考是一個原生的 INT4 量化模型,具備 262k 文本窗戶,實現了推理延遲和 GPU 記憶體使用的無損減少。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.55
/
$
2.5
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
可用
架構
經過校準的
是
專家並行
是
總參數
1000B
啟用的參數
32B
推理
不
精度
FP8
上下文長度
262K
最大輸出長度
262K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
支持
結構化輸出
不支持
工具
支持
中間填充補全
不支持
聊天前綴補全
支持
與其他模型比較
看看這個模型與其他模型的對比如何。

Moonshot AI
聊天
Kimi-K2-Thinking
發行日期:2025年11月7日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.55
/ M Tokens
輸出:
$
2.5
/ M Tokens

Moonshot AI
聊天
Kimi-K2-Instruct-0905
發行日期:2025年9月8日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.4
/ M Tokens
輸出:
$
2.0
/ M Tokens

Moonshot AI
聊天
Kimi-K2-Instruct
發行日期:2025年7月13日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.58
/ M Tokens
輸出:
$
2.29
/ M Tokens

Moonshot AI
聊天
Kimi-Dev-72B
發行日期:2025年6月19日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.29
/ M Tokens
輸出:
$
1.15
/ M Tokens
