Kimi-K2-Thinking
Tentang Kimi-K2-Thinking
Kimi K2 Thinking adalah versi terbaru dan paling canggih dari model pemikiran open-source. Dimulai dengan Kimi K2, kami membangunnya sebagai agen pemikiran yang bernalar secara bertahap sambil secara dinamis mengaktifkan alat. Ini menetapkan standar baru di Humanity's Last Exam (HLE), BrowseComp, dan tolok ukur lainnya dengan memperbesar kedalaman penalaran multi-langkah secara dramatis dan mempertahankan penggunaan alat yang stabil dalam 200–300 panggilan berurutan. Pada saat yang sama, K2 Thinking adalah model kuantisasi INT4 asli dengan jendela konteks 262k, mencapai pengurangan latensi Inference dan penggunaan memori GPU tanpa kehilangan.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.55
/
$
2.5
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Ya
Campuran Ahli
Ya
Total Parameter
1000B
Parameter yang Diaktifkan
32B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
262K
Max Tokens
262K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
didukung
Output Terstruktur
Tidak didukung
Alat
didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

Moonshot AI
chat
Kimi-K2.5
Dirilis pada: 30 Jan 2026
Total Context:
262K
Max output:
262K
Input:
$
0.55
/ M Tokens
Output:
$
3.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Thinking
Dirilis pada: 7 Nov 2025
Total Context:
262K
Max output:
262K
Input:
$
0.55
/ M Tokens
Output:
$
2.5
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct-0905
Dirilis pada: 8 Sep 2025
Total Context:
262K
Max output:
262K
Input:
$
0.4
/ M Tokens
Output:
$
2.0
/ M Tokens

Moonshot AI
chat
Kimi-K2-Instruct
Dirilis pada: 13 Jul 2025
Total Context:
131K
Max output:
131K
Input:
$
0.58
/ M Tokens
Output:
$
2.29
/ M Tokens

Moonshot AI
chat
Kimi-Dev-72B
Dirilis pada: 19 Jun 2025
Total Context:
131K
Max output:
131K
Input:
$
0.29
/ M Tokens
Output:
$
1.15
/ M Tokens
