Kimi K2.5 Sekarang di SiliconFlow: SOTA pada Kecerdasan Visual Agens

4 Feb 2026

Daftar Isi

TL;DR: Kimi K2.5 kini tersedia di SiliconFlow. Sebagai model open-source paling kuat hingga saat ini, model ini menggabungkan kemampuan coding dan vision mutakhir dengan arsitektur Agent Swarm yang bisa mengkoordinasikan hingga 100 sub-agen dan 1.500 panggilan alat. Ini menghasilkan hingga 4.5× percepatan dibandingkan eksekusi agen tunggal. Didukung oleh kemampuan, K2.5 memberikan kinerja yang kuat di seluruh alur kerja coding-dengan-vision, alur kerja agensi, dan skenario produktivitas kantor dunia nyata. Mulailah membangun hari ini dengan API SiliconFlow untuk menghadirkan intelijensi agensi visual SoTA ke dalam produksi.

Kami sangat senang membawa Kimi K2.5 ke SiliconFlow, membuka era baru intelijensi agensi visual bagi pengembang di seluruh dunia. Dibangun di atas Kimi K2 melalui pelatihan berkelanjutan pada sekitar 15T token visual dan teks, model ini memberikan kemampuan coding dan vision mutakhir sebagai model multimodal asli. K2.5 juga memperkenalkan paradigma Agent Swarm yang dapat mengkoordinasikan hingga 100 sub-agen khusus yang menjalankan alur kerja paralel hingga 1.500 langkah terkoordinasi, tanpa peran yang ditentukan atau alur kerja yang dibuat tangan.

Sekarang, melalui API Kimi K2.5 dari SiliconFlow, Anda dapat mengharapkan:

  • Harga Kompetitif: Kimi K2.5: $0,55/J tokens (Input) dan $3,0/J tokens (Output)

  • Jendela Konteks 262K: Tangani dokumen panjang, percakapan kompleks, dan alur kerja multi-agen yang diperpanjang dengan input visual yang kaya.

  • Integrasi Tanpa Hambatan: Terapkan langsung melalui API yang kompatibel dengan OpenAI dari SiliconFlow, atau integrasikan dengan Claude Code, Kilo Code, Roo Code, OpenClaw dan lainnya.

Apakah Anda sedang membangun front-end interaktif dari permintaan visual, melakukan riset kompleks dengan eksekusi agen paralel, atau mengotomatisasi alur kerja kantor untuk menghasilkan dokumen dan presentasi tingkat ahli, API Kimi K2.5 dari SiliconFlow memberikan kinerja yang Anda butuhkan.

Di bagian berikut, kami akan memecah fitur-fitur utama K2.5, menampilkan bagaimana kinerjanya dalam tugas-tugas dunia nyata melalui API SiliconFlow dan memberikan tips konfigurasi untuk memaksimalkan kinerja untuk alur kerja Anda.

Apa yang baru dari K2.5

Lihat bagaimana ia merekonstruksi situs web dari satu tangkapan layar, menyempurnakan kode melalui percakapan alami, dan mengubah mockup desain menjadi komponen React yang siap produksi dengan animasi. Ketika ditugaskan dengan analisis pasar, ia dapat mengorkestrasi 100 peneliti khusus yang melaksanakan 1.500 langkah terkoordinasi secara paralel.

Kali ini, K2.5 menghadirkan tiga fitur fundamental:

Multimodality Asli

K2.5 unggul dalam pengetahuan visual, penalaran lintas-modal, dan penggunaan alat agensi yang didasarkan pada input visual—kemampuan yang berasal dari wawasan fundamental dalam pelatihannya: dalam skala besar, vision dan text tidak bersaing, mereka saling memperkuat. Di-pratri dari 15T token vision–language dari awal, K2.5 belajar untuk melihat dan mengkode sebagai satu keterampilan terpadu.

Coding dengan Vision

Itu tidak hanya "melihat" gambar—itu menalar di seluruh input visual dan menerjemahkannya langsung menjadi kode siap produksi. Sebagai model open-source terkuat hingga saat ini, K2.5 sangat unggul dalam pengembangan front-end. Tunjukkan tangkapan layar UI untuk debugging masalah layout, atau unggah mockup desain untuk menghasilkan komponen React interaktif dengan animasi dan tata letak responsif. Hal ini secara mendasar mengubah cara pengembang menyatakan maksud dan menurunkan hambatan untuk melakukannya: alih-alih menulis spesifikasi terperinci, Anda dapat menunjukkan kepada K2.5 apa yang Anda inginkan secara visual.

Prompt: Hey, saya benar-benar menyukai seluruh suasana situs web Zara (screenshot terlampir)—Anda tahu, tampilan bersih, minimalis dengan tipografi yang bagus dan animasi yang mulus. Sementara itu, saya ingin membuat situs portofolio untuk karya desain saya. Bisakah Anda membantu saya membuat sesuatu dengan gaya serupa? Juga, sangat penting, saya ingin memastikan tata letak solid tanpa elemen yang tumpang tindih atau apa pun yang rusak. Semuanya harus sepenuhnya berfungsi dan terlihat bersih saat saya membukanya.

Agent Swarm

K2.5 beralih dari skala agen tunggal ke Agent Swarm yang mengkoordinasikan sendiri—memecah tugas-tugas kompleks menjadi sub-tugas paralel yang dieksekusi oleh agen-agen khusus.

Begini cara kerjanya: Mintalah K2.5 untuk mengidentifikasi tiga YouTuber teratas di 100 bidang profesional yang khusus. Orkestrator pertama kali meneliti dan mendefinisikan domain yang beragam ini—segalanya mulai dari linguistik komputasi hingga kimia kuantum. Kemudian itu memunculkan 100 sub-agen khusus, masing-masing ditugaskan untuk meneliti bidang tertentu. Agen-agen ini bekerja secara paralel, secara independen mengumpulkan data dan menganalisis pembuat konten. Hasilnya? 300 profil YouTuber yang komprehensif dan laporan terkonsolidasi—dikirimkan dalam waktu yang jauh lebih singkat dibandingkan agen tunggal.

Dalam evaluasi internal Moonshot AI, K2.5 Agent Swarm menyebabkan pengurangan 80% dalam runtime end-to-end sambil mendukung beban kerja yang lebih kompleks, jangka panjang, seperti ditunjukkan di bawah ini.

Kinerja Benchmark

Kimi K2.5 menempati peringkat #1 dalam benchmark Agentic dan mencapai kinerja tingkat terdepan di seluruh kategori utama lainnya, menempatkannya dalam tingkat yang sama dengan GPT-5.2, Claude 4.5 Opus, dan Gemini 3.0 Pro. Kemampuan yang komprehensif ini menjadikannya siap untuk penerapan produksi di berbagai alur kerja:

Kategori

Benchmark

Kimi K2.5

GPT-5.2 (sangat tinggi)

Claude 4.5 Opus (pemikiran diperpanjang)

Gemini 3 pro
(tingkat pemikiran tinggi)

Agen

HLE-Full

🥇50.2

45.5

43.2

45.8


BrowseComp

🥇74.9

65.8

57.8

59.2


DeepSearchQA

🥇77.1

71.3

76.1

63.2

Coding

SWE-Bench Verified

76.8

80

80.9

76.2


SWE-Bench Multilingual

73

72

77.5

65

Image

MMMU Pro

78.5

79.5

74

81


MathVision

84.2

83

77.1

86.1


OmniDocBench 1.5

🥇88.8

85.7

87.7

88.5

Video

VideoMMMU

86.6

85.9

84.4

87.6


LongVideoBench

🥇79.8

76.5

67.2

77.7

Sejak dirilis, Kimi K2.5 juga membuat gelombang di arena evaluasi lainnya:

  • OSWorld (Eksekusi Agen): Menduduki peringkat #1 dengan tingkat keberhasilan 63,3%, melampaui Claude Sonnet 4.5 (62,9%) dan Seed-1.8 (61,9%) pada tugas lingkungan komputer riil.

  • DesignArena (Generasi UI): Skor 1349—tertinggi di antara semua model, melampaui Gemini 3 Pro, Claude Opus 4.5, dan GLM-4.7. K2.5 sangat unggul dalam desain 3D, pembuatan situs web, dan tugas pembuatan SVG.

  • Vision Arena (Multimodal): Menduduki peringkat #1 di antara model open-source dan #6 secara keseluruhan dengan skor 1249, di atas GPT-5.1 (1238) dalam memahami dan memproses input visual.


Mulai Menggunakan K2.5 di Alat Favorit Anda

Kimi K2.5 kini tersedia di SiliconFlow. Integrasikan ke dalam alur kerja pengembangan Anda melalui:

Kilo Code/Claude Code/Cline/Roo Code/ OpenClaw/SillyTavern/Kimi Code/Trae dan banyak lagi

Dapatkan Akses API →

Lihat Dokumentasi →

Tips Konfigurasi K2.5

Untuk mendapatkan kinerja terbaik dari Kimi K2.5 di SiliconFlow, ikuti rekomendasi pengaturan berikut:

Parameter

Direkomendasikan

Catatan

Mode Instan: Respon cepat, tugas sehari-hari

enable_thinking

FALSE

Menonaktifkan proses penalaran untuk respon yang lebih cepat

temperature

0,6

Dioptimalkan untuk output yang konsisten dan fokus

top_p

0,95

Parameter sampling standar

Mode Pemikiran: Penalaran mendalam, masalah kompleks

enable_thinking

TRUE

Mengaktifkan penalaran langkah demi langkah

temperature

1,0

Kreativitas lebih tinggi untuk penalaran kompleks

top_p

0,95

Parameter sampling standar

Catatan: Input Video saat ini adalah eksperimental dan hanya didukung oleh API resmi MoonShotAI.

Mulai Segera

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)


Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow