目錄
總結: Kimi K2.5 現在在 SiliconFlow 上可用。作為迄今為止最強大的開源 Model,它將最先進的編碼和 Vision 能力與自主的Agent Swarm架構結合起來,能夠協調多達 100 個子代理和 1,500 個工具調用。這使得單代理執行加速多達 4.5 倍。K2.5 借助能力提供了在編碼與 Vision、代理工作流程及現實辦公生產力場景中強大的表現。立即開始使用 SiliconFlow 的 API 構建,將最先進的視覺代理智能投入生產。
我們很高興能將 Kimi K2.5 帶到 SiliconFlow
,為全球開發者開啟視覺代理智能的新時代。通過對< a id="6">Kimi K2進行持續預訓練,涵蓋約 15T 混合視覺和 Text tokens ,它作為本地 Multimodal Model 提供了最先進的編碼和 Vision 能力。K2.5 還引入了一種自主的 Agent Swarm 範式,可以協調多達 100 個專業化的子代理,執行多達 1,500 步的並行工作流程,無需預定義角色或手工製作的工作流程。
<,為全球開發者開啟視覺代理智能的新時代。通過對>
現在,通過 SiliconFlow 的 Kimi K2.5 API,您可以期待:
競爭力的定價: Kimi K2.5: $0.55/百萬 tokens (Input) 和 $3.0/百萬 tokens (Output)
262K 範圍窗口: 處理長文檔、複雜對話以及具有豐富視覺輸入的擴展多代理工作流程。
無縫集成: 通過 SiliconFlow 的 OpenAI 兼容 API 即刻部署,或無縫集成到 Claude Code、Kilo Code、Roo Code、OpenClaw 等系統中。
無論您是在從事互動前端建構、使用並行代理執行進行複雜研究,還是自動化辦公工作流程以生成專家級文檔和演示文稿,SiliconFlow 的 Kimi K2.5 API 都能提供您所需的性能。
接下來的章節中,我們將分解 K2.5 的關鍵功能,展示它如何通過 SiliconFlow 的 API 在真實世界任務中運行,並提供配置技巧以最大化您的工作流程性能。
K2.5 的新特性
看看它是如何從單個截圖中重建網站,通過自然對話改進代碼,並將設計稿轉化為生產就緒的 React 組件並附帶動畫的。當進行市場分析時,它可以協調 100 名專業研究人員並行執行 1,500 步協調的步驟。
這一次,K2.5 提供了三個基本特點:
本地 Multimodality
K2.5 在視覺知識、跨模態推理和基於視覺 Input 的代理工具使用方面表現出色——能力來自於訓練中一項基本見解:大規模時,Vision 和 Text 不是競爭,而是相互強化。 從視覺-語言 15T tokens 出發進行預訓練,K2.5 學會將「看」和「編碼」作為一種統一的技能。
與 Vision 合作編碼
它不僅僅是「看見」 Image ——而是基於視覺 Input 進行推理,並直接將其轉化為生產就緒的代碼。作為迄今為止最強的開源 Model,K2.5 尤其在前端開發中表現出色。向它展示 UI 截圖以調試佈局問題,或上傳設計樣本,以生成具有動畫和響應式佈局的互動 React 組件。這從根本上改變了開發者表達意圖的方式並降低了門檻:與其寫下詳細規範,不如直觀展示你所需。
提示:嘿,我真的很喜歡 Zara 網站的整體風格(截圖附上)——你知道的,乾淨、極簡主義的外觀,字體排版和流暢動畫都很好。與此同時,我想為我的設計作品建一個作品集網站。你能幫我創建一些相似風格的嗎?另外,真的很重要,我想確保佈局穩固,沒有重疊元素或損壞。打開時應該全部功能正常,並且看起來乾淨。
Agent Swarm
K2.5 從單一代理擴展轉向自主協調的 Agent Swarm——將複雜任務分解為由專業代理執行的並行子任務。
工作方式如下:命令 K2.5 識別 100 個專業領域中的前三名 YouTuber。調度器先研究並界定這些多元領域——從計算語言學到量子化學一應俱全。然後它生成 100 個專業子代理,每個代理負責研究一個特定領域。這些代理並行工作,獨立收集數據和分析內容創作者。結果?300 個完整的 YouTuber 檔案和一份綜合報告——比單一代理耗時要少得多。
在 Moonshot AI 的內部評估中,K2.5 Agent Swarm 使端到端運行時間縮短了 80%,同時使更複雜的長期工作負載成為可能,如下所示。

基準表現
Kimi K2.5 在<強>代理基準測試中排名#1,在其他主要類別中也達到了前沿水平,使其與 GPT-5.2、Claude 4.5 Opus 和 Gemini 3.0 Pro 併列。這一綜合能力使其可在不同工作流程中投入生產部署:
類別 | 基準 | Kimi K2.5 | GPT-5.2 (xhigh) | Claude 4.5 Opus (extended thinking) | Gemini 3 pro |
代理 | HLE-Full | 🥇50.2 | 45.5 | 43.2 | 45.8 |
BrowseComp | 🥇74.9 | 65.8 | 57.8 | 59.2 | |
DeepSearchQA | 🥇77.1 | 71.3 | 76.1 | 63.2 | |
編碼 | SWE-Bench 已驗證 | 76.8 | 80 | 80.9 | 76.2 |
SWE-Bench 多語言 | 73 | 72 | 77.5 | 65 | |
Image | MMMU Pro | 78.5 | 79.5 | 74 | 81 |
MathVision | 84.2 | 83 | 77.1 | 86.1 | |
OmniDocBench 1.5 | 🥇88.8 | 85.7 | 87.7 | 88.5 | |
Video | VideoMMMU | 86.6 | 85.9 | 84.4 | 87.6 |
LongVideoBench | 🥇79.8 | 76.5 | 67.2 | 77.7 |
自發行以來,Kimi K2.5 也在其他評估場中處於領先地位:
OSWorld(代理執行):以 63.3% 的成功率排名#1,超過 Claude Sonnet 4.5(62.9%)和 Seed-1.8(61.9%)在真實計算機環境任務上的表現。
DesignArena(UI 生成):以 1349 分——所有 Model 中最高,超過 Gemini 3 Pro、Claude Opus 4.5 和 GLM-4.7。K2.5 在 3D 設計、網站創建和 SVG 生成任務中表現尤為出色。
Vision Arena(Multimodal):在開源 Model 中排名#1,總體排名第 6,以 1249 分領先於 GPT-5.1(1238)在理解和處理視覺輸入方面。
立即開始在您喜愛的工具中使用 K2.5
Kimi K2.5 現在在 SiliconFlow 上可用。將其集成到您的開發工作流程中,通過:
Kilo Code/Claude Code/Cline/Roo Code/ OpenClaw/SillyTavern/Kimi Code/Trae 和更多
K2.5 配置提示
要在 SiliconFlow 上獲得 Kimi K2.5 的最佳性能,請遵循以下推薦設置:
參數 | 推薦 | 注意事項 |
即時模式:快速響應,日常任務 | ||
enable_thinking | FALSE | 禁用推理過程以獲得更快響應 |
temperature | 0.6 | 優化為一致、專注的輸出 |
top_p | 0.95 | 標準採樣參數 |
思考模式:深思熟慮,複雜問題 | ||
enable_thinking | TRUE | 啟用逐步推理 |
temperature | 1.0 | 更高的創造力以應對複雜推理 |
top_p | 0.95 | 標準採樣參數 |
注意:Video Input 目前處於實驗階段,僅 MoonShotAI 的官方 API 支持。
立即開始
探索: 在 SiliconFlow Playground 上試試 Kimi K2.5。
集成: 使用我們的 OpenAI 兼容 API。探索 SiliconFlow API 文檔中的完整 API 規範。

