約Kimi-K2-Thinking
Kimi K2 Thinkingは最新かつ最も能力のあるオープンソースの思考モデルです。Kimi K2から始まり、段階的にツールを動的に利用する思考エージェントとして構築されました。人類最後の試験(HLE)、BrowseComp、その他のベンチマークで新たな最先端技術を設定し、複数ステップの推論深度を劇的に拡大し、200〜300の連続コールで安定したツール使用を維持します。同時に、K2 ThinkingはINT4量子化のネイティブModelで、262kコンテキストウィンドウを持ち、Inferenceの待ち時間とGPUメモリ使用量の損失のない削減を達成しています
利用可能な Serverless
クエリをすぐに実行し、使用量のみを支払います
$
0.55
/
$
2.5
100万トークン(Input/Output)ごとに
メタデータ
仕様
州
Available
建築
キャリブレートされた
はい
専門家の混合
はい
合計パラメータ
1000B
アクティブ化されたパラメータ
32B
推論
いいえ
Precision
FP8
コンテキスト長
262K
Max Tokens
262K
対応機能
Serverless
対応
Serverless LoRA
サポートされていません
Fine-tuning
サポートされていません
Embeddings
サポートされていません
Rerankers
サポートされていません
Image入力をサポートする
サポートされていません
JSON Mode
対応
構造化されたOutputs
サポートされていません
ツール
対応
Fim Completion
サポートされていません
Chat Prefix Completion
対応
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。

Moonshot AI
chat
Kimi-K2.5
リリース日:2026/01/30
Total Context:
262K
Max output:
262K
Input:
$
0.55
/ M Tokens
Output:
$
3.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Thinking
リリース日:2025/11/07
Total Context:
262K
Max output:
262K
Input:
$
0.55
/ M Tokens
Output:
$
2.5
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct-0905
リリース日:2025/09/08
Total Context:
262K
Max output:
262K
Input:
$
0.4
/ M Tokens
Output:
$
2.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct
リリース日:2025/07/13
Total Context:
131K
Max output:
131K
Input:
$
0.58
/ M Tokens
Output:
$
2.29
/ M Tokens

Moonshot AI
chat
Kimi-Dev-72B
リリース日:2025/06/19
Total Context:
131K
Max output:
131K
Input:
$
0.29
/ M Tokens
Output:
$
1.15
/ M Tokens
