Daftar Isi
TL;DR: Kimi K2.5 kini tersedia di SiliconFlow. Sebagai model open-source paling kuat hingga saat ini, model ini menggabungkan kemampuan coding dan vision mutakhir dengan arsitektur Agent Swarm yang bisa mengkoordinasikan hingga 100 sub-agen dan 1.500 panggilan alat. Ini menghasilkan hingga 4.5× percepatan dibandingkan eksekusi agen tunggal. Didukung oleh kemampuan, K2.5 memberikan kinerja yang kuat di seluruh alur kerja coding-dengan-vision, alur kerja agensi, dan skenario produktivitas kantor dunia nyata. Mulailah membangun hari ini dengan API SiliconFlow untuk menghadirkan intelijensi agensi visual SoTA ke dalam produksi.
Kami sangat senang membawa Kimi K2.5 ke SiliconFlow, membuka era baru intelijensi agensi visual bagi pengembang di seluruh dunia. Dibangun di atas Kimi K2 melalui pelatihan berkelanjutan pada sekitar 15T token visual dan teks, model ini memberikan kemampuan coding dan vision mutakhir sebagai model multimodal asli. K2.5 juga memperkenalkan paradigma Agent Swarm yang dapat mengkoordinasikan hingga 100 sub-agen khusus yang menjalankan alur kerja paralel hingga 1.500 langkah terkoordinasi, tanpa peran yang ditentukan atau alur kerja yang dibuat tangan.
Sekarang, melalui API Kimi K2.5 dari SiliconFlow, Anda dapat mengharapkan:
Harga Kompetitif: Kimi K2.5: $0,55/J tokens (Input) dan $3,0/J tokens (Output)
Jendela Konteks 262K: Tangani dokumen panjang, percakapan kompleks, dan alur kerja multi-agen yang diperpanjang dengan input visual yang kaya.
Integrasi Tanpa Hambatan: Terapkan langsung melalui API yang kompatibel dengan OpenAI dari SiliconFlow, atau integrasikan dengan Claude Code, Kilo Code, Roo Code, OpenClaw dan lainnya.
Apakah Anda sedang membangun front-end interaktif dari permintaan visual, melakukan riset kompleks dengan eksekusi agen paralel, atau mengotomatisasi alur kerja kantor untuk menghasilkan dokumen dan presentasi tingkat ahli, API Kimi K2.5 dari SiliconFlow memberikan kinerja yang Anda butuhkan.
Di bagian berikut, kami akan memecah fitur-fitur utama K2.5, menampilkan bagaimana kinerjanya dalam tugas-tugas dunia nyata melalui API SiliconFlow dan memberikan tips konfigurasi untuk memaksimalkan kinerja untuk alur kerja Anda.
Apa yang baru dari K2.5
Lihat bagaimana ia merekonstruksi situs web dari satu tangkapan layar, menyempurnakan kode melalui percakapan alami, dan mengubah mockup desain menjadi komponen React yang siap produksi dengan animasi. Ketika ditugaskan dengan analisis pasar, ia dapat mengorkestrasi 100 peneliti khusus yang melaksanakan 1.500 langkah terkoordinasi secara paralel.
Kali ini, K2.5 menghadirkan tiga fitur fundamental:
Multimodality Asli
K2.5 unggul dalam pengetahuan visual, penalaran lintas-modal, dan penggunaan alat agensi yang didasarkan pada input visual—kemampuan yang berasal dari wawasan fundamental dalam pelatihannya: dalam skala besar, vision dan text tidak bersaing, mereka saling memperkuat. Di-pratri dari 15T token vision–language dari awal, K2.5 belajar untuk melihat dan mengkode sebagai satu keterampilan terpadu.
Coding dengan Vision
Itu tidak hanya "melihat" gambar—itu menalar di seluruh input visual dan menerjemahkannya langsung menjadi kode siap produksi. Sebagai model open-source terkuat hingga saat ini, K2.5 sangat unggul dalam pengembangan front-end. Tunjukkan tangkapan layar UI untuk debugging masalah layout, atau unggah mockup desain untuk menghasilkan komponen React interaktif dengan animasi dan tata letak responsif. Hal ini secara mendasar mengubah cara pengembang menyatakan maksud dan menurunkan hambatan untuk melakukannya: alih-alih menulis spesifikasi terperinci, Anda dapat menunjukkan kepada K2.5 apa yang Anda inginkan secara visual.
Prompt: Hey, saya benar-benar menyukai seluruh suasana situs web Zara (screenshot terlampir)—Anda tahu, tampilan bersih, minimalis dengan tipografi yang bagus dan animasi yang mulus. Sementara itu, saya ingin membuat situs portofolio untuk karya desain saya. Bisakah Anda membantu saya membuat sesuatu dengan gaya serupa? Juga, sangat penting, saya ingin memastikan tata letak solid tanpa elemen yang tumpang tindih atau apa pun yang rusak. Semuanya harus sepenuhnya berfungsi dan terlihat bersih saat saya membukanya.
Agent Swarm
K2.5 beralih dari skala agen tunggal ke Agent Swarm yang mengkoordinasikan sendiri—memecah tugas-tugas kompleks menjadi sub-tugas paralel yang dieksekusi oleh agen-agen khusus.
Begini cara kerjanya: Mintalah K2.5 untuk mengidentifikasi tiga YouTuber teratas di 100 bidang profesional yang khusus. Orkestrator pertama kali meneliti dan mendefinisikan domain yang beragam ini—segalanya mulai dari linguistik komputasi hingga kimia kuantum. Kemudian itu memunculkan 100 sub-agen khusus, masing-masing ditugaskan untuk meneliti bidang tertentu. Agen-agen ini bekerja secara paralel, secara independen mengumpulkan data dan menganalisis pembuat konten. Hasilnya? 300 profil YouTuber yang komprehensif dan laporan terkonsolidasi—dikirimkan dalam waktu yang jauh lebih singkat dibandingkan agen tunggal.
Dalam evaluasi internal Moonshot AI, K2.5 Agent Swarm menyebabkan pengurangan 80% dalam runtime end-to-end sambil mendukung beban kerja yang lebih kompleks, jangka panjang, seperti ditunjukkan di bawah ini.

Kinerja Benchmark
Kimi K2.5 menempati peringkat #1 dalam benchmark Agentic dan mencapai kinerja tingkat terdepan di seluruh kategori utama lainnya, menempatkannya dalam tingkat yang sama dengan GPT-5.2, Claude 4.5 Opus, dan Gemini 3.0 Pro. Kemampuan yang komprehensif ini menjadikannya siap untuk penerapan produksi di berbagai alur kerja:
Kategori | Benchmark | Kimi K2.5 | GPT-5.2 (sangat tinggi) | Claude 4.5 Opus (pemikiran diperpanjang) | Gemini 3 pro |
Agen | HLE-Full | 🥇50.2 | 45.5 | 43.2 | 45.8 |
BrowseComp | 🥇74.9 | 65.8 | 57.8 | 59.2 | |
DeepSearchQA | 🥇77.1 | 71.3 | 76.1 | 63.2 | |
Coding | SWE-Bench Verified | 76.8 | 80 | 80.9 | 76.2 |
SWE-Bench Multilingual | 73 | 72 | 77.5 | 65 | |
Image | MMMU Pro | 78.5 | 79.5 | 74 | 81 |
MathVision | 84.2 | 83 | 77.1 | 86.1 | |
OmniDocBench 1.5 | 🥇88.8 | 85.7 | 87.7 | 88.5 | |
Video | VideoMMMU | 86.6 | 85.9 | 84.4 | 87.6 |
LongVideoBench | 🥇79.8 | 76.5 | 67.2 | 77.7 |
Sejak dirilis, Kimi K2.5 juga membuat gelombang di arena evaluasi lainnya:
OSWorld (Eksekusi Agen): Menduduki peringkat #1 dengan tingkat keberhasilan 63,3%, melampaui Claude Sonnet 4.5 (62,9%) dan Seed-1.8 (61,9%) pada tugas lingkungan komputer riil.
DesignArena (Generasi UI): Skor 1349—tertinggi di antara semua model, melampaui Gemini 3 Pro, Claude Opus 4.5, dan GLM-4.7. K2.5 sangat unggul dalam desain 3D, pembuatan situs web, dan tugas pembuatan SVG.
Vision Arena (Multimodal): Menduduki peringkat #1 di antara model open-source dan #6 secara keseluruhan dengan skor 1249, di atas GPT-5.1 (1238) dalam memahami dan memproses input visual.
Mulai Menggunakan K2.5 di Alat Favorit Anda
Kimi K2.5 kini tersedia di SiliconFlow. Integrasikan ke dalam alur kerja pengembangan Anda melalui:
Kilo Code/Claude Code/Cline/Roo Code/ OpenClaw/SillyTavern/Kimi Code/Trae dan banyak lagi
Tips Konfigurasi K2.5
Untuk mendapatkan kinerja terbaik dari Kimi K2.5 di SiliconFlow, ikuti rekomendasi pengaturan berikut:
Parameter | Direkomendasikan | Catatan |
Mode Instan: Respon cepat, tugas sehari-hari | ||
enable_thinking | FALSE | Menonaktifkan proses penalaran untuk respon yang lebih cepat |
temperature | 0,6 | Dioptimalkan untuk output yang konsisten dan fokus |
top_p | 0,95 | Parameter sampling standar |
Mode Pemikiran: Penalaran mendalam, masalah kompleks | ||
enable_thinking | TRUE | Mengaktifkan penalaran langkah demi langkah |
temperature | 1,0 | Kreativitas lebih tinggi untuk penalaran kompleks |
top_p | 0,95 | Parameter sampling standar |
Catatan: Input Video saat ini adalah eksperimental dan hanya didukung oleh API resmi MoonShotAI.
Mulai Segera
Jelajahi: Coba Kimi K2.5 di playground SiliconFlow.
Integrasikan: Gunakan API kami yang kompatibel dengan OpenAI. Jelajahi spesifikasi API lengkap di dokumentasi API SiliconFlow.

