Kimi K2.5 現在在 SiliconFlow 上：視覺代理智能的SOTA

2026年2月4日

總結： Kimi K2.5 現在在 SiliconFlow 上可用。作為迄今為止最強大的開源 Model，它將最先進的編碼和 Vision 能力與自主的Agent Swarm架構結合起來，能夠協調多達 100 個子代理和 1,500 個工具調用。這使得單代理執行加速多達 4.5 倍。K2.5 借助能力提供了在編碼與 Vision、代理工作流程及現實辦公生產力場景中強大的表現。立即開始使用 SiliconFlow 的 API 構建，將最先進的視覺代理智能投入生產。

我們很高興能將 Kimi K2.5 帶到 SiliconFlow

，為全球開發者開啟視覺代理智能的新時代。通過對< a id="6">Kimi K2進行持續預訓練，涵蓋約 15T 混合視覺和 Text tokens ，它作為本地 Multimodal Model 提供了最先進的編碼和 Vision 能力。K2.5 還引入了一種自主的 Agent Swarm 範式，可以協調多達 100 個專業化的子代理，執行多達 1,500 步的並行工作流程，無需預定義角色或手工製作的工作流程。

<，為全球開發者開啟視覺代理智能的新時代。通過對>

現在，通過 SiliconFlow 的 Kimi K2.5 API，您可以期待：

競爭力的定價： Kimi K2.5: $0.55/百萬 tokens (Input) 和 $3.0/百萬 tokens (Output)
262K 範圍窗口： 處理長文檔、複雜對話以及具有豐富視覺輸入的擴展多代理工作流程。
無縫集成： 通過 SiliconFlow 的 OpenAI 兼容 API 即刻部署，或無縫集成到 Claude Code、Kilo Code、Roo Code、OpenClaw 等系統中。

無論您是在從事互動前端建構、使用並行代理執行進行複雜研究，還是自動化辦公工作流程以生成專家級文檔和演示文稿，SiliconFlow 的 Kimi K2.5 API 都能提供您所需的性能。

接下來的章節中，我們將分解 K2.5 的關鍵功能，展示它如何通過 SiliconFlow 的 API 在真實世界任務中運行，並提供配置技巧以最大化您的工作流程性能。

K2.5 的新特性

看看它是如何從單個截圖中重建網站，通過自然對話改進代碼，並將設計稿轉化為生產就緒的 React 組件並附帶動畫的。當進行市場分析時，它可以協調 100 名專業研究人員並行執行 1,500 步協調的步驟。

這一次，K2.5 提供了三個基本特點：

本地 Multimodality

K2.5 在視覺知識、跨模態推理和基於視覺 Input 的代理工具使用方面表現出色——能力來自於訓練中一項基本見解：大規模時，Vision 和 Text 不是競爭，而是相互強化。 從視覺-語言 15T tokens 出發進行預訓練，K2.5 學會將「看」和「編碼」作為一種統一的技能。

與 Vision 合作編碼

它不僅僅是「看見」 Image ——而是基於視覺 Input 進行推理，並直接將其轉化為生產就緒的代碼。作為迄今為止最強的開源 Model，K2.5 尤其在前端開發中表現出色。向它展示 UI 截圖以調試佈局問題，或上傳設計樣本，以生成具有動畫和響應式佈局的互動 React 組件。這從根本上改變了開發者表達意圖的方式並降低了門檻：與其寫下詳細規範，不如直觀展示你所需。

提示：嘿，我真的很喜歡 Zara 網站的整體風格（截圖附上）——你知道的，乾淨、極簡主義的外觀，字體排版和流暢動畫都很好。與此同時，我想為我的設計作品建一個作品集網站。你能幫我創建一些相似風格的嗎？另外，真的很重要，我想確保佈局穩固，沒有重疊元素或損壞。打開時應該全部功能正常，並且看起來乾淨。

Agent Swarm

K2.5 從單一代理擴展轉向自主協調的 Agent Swarm——將複雜任務分解為由專業代理執行的並行子任務。

工作方式如下：命令 K2.5 識別 100 個專業領域中的前三名 YouTuber。調度器先研究並界定這些多元領域——從計算語言學到量子化學一應俱全。然後它生成 100 個專業子代理，每個代理負責研究一個特定領域。這些代理並行工作，獨立收集數據和分析內容創作者。結果？300 個完整的 YouTuber 檔案和一份綜合報告——比單一代理耗時要少得多。

在 Moonshot AI 的內部評估中，K2.5 Agent Swarm 使端到端運行時間縮短了 80%，同時使更複雜的長期工作負載成為可能，如下所示。

基準表現

Kimi K2.5 在<強>代理基準測試中排名#1，在其他主要類別中也達到了前沿水平，使其與 GPT-5.2、Claude 4.5 Opus 和 Gemini 3.0 Pro 併列。這一綜合能力使其可在不同工作流程中投入生產部署：

類別	基準	Kimi K2.5	GPT-5.2 (xhigh)	Claude 4.5 Opus (extended thinking)	Gemini 3 pro (high thinking-level)
代理	HLE-Full	🥇50.2	45.5	43.2	45.8
	BrowseComp	🥇74.9	65.8	57.8	59.2
	DeepSearchQA	🥇77.1	71.3	76.1	63.2
編碼	SWE-Bench 已驗證	76.8	80	80.9	76.2
	SWE-Bench 多語言	73	72	77.5	65
Image	MMMU Pro	78.5	79.5	74	81
	MathVision	84.2	83	77.1	86.1
	OmniDocBench 1.5	🥇88.8	85.7	87.7	88.5
Video	VideoMMMU	86.6	85.9	84.4	87.6
	LongVideoBench	🥇79.8	76.5	67.2	77.7

自發行以來，Kimi K2.5 也在其他評估場中處於領先地位：

OSWorld（代理執行）：以 63.3% 的成功率排名#1，超過 Claude Sonnet 4.5（62.9%）和 Seed-1.8（61.9%）在真實計算機環境任務上的表現。
DesignArena（UI 生成）：以 1349 分——所有 Model 中最高，超過 Gemini 3 Pro、Claude Opus 4.5 和 GLM-4.7。K2.5 在 3D 設計、網站創建和 SVG 生成任務中表現尤為出色。
Vision Arena（Multimodal）：在開源 Model 中排名#1，總體排名第 6，以 1249 分領先於 GPT-5.1（1238）在理解和處理視覺輸入方面。

立即開始在您喜愛的工具中使用 K2.5

Kimi K2.5 現在在 SiliconFlow 上可用。將其集成到您的開發工作流程中，通過：

Kilo Code/Claude Code/Cline/Roo Code/ OpenClaw/SillyTavern/Kimi Code/Trae 和更多

獲取 API 訪問 →

查看文檔 →

K2.5 配置提示

要在 SiliconFlow 上獲得 Kimi K2.5 的最佳性能，請遵循以下推薦設置：

參數	推薦	注意事項
即時模式：快速響應，日常任務
enable_thinking	FALSE	禁用推理過程以獲得更快響應
temperature	0.6	優化為一致、專注的輸出
top_p	0.95	標準採樣參數
思考模式：深思熟慮，複雜問題
enable_thinking	TRUE	啟用逐步推理
temperature	1.0	更高的創造力以應對複雜推理
top_p	0.95	標準採樣參數

注意：Video Input 目前處於實驗階段，僅 MoonShotAI 的官方 API 支持。

立即開始

探索： 在 SiliconFlow Playground 上試試 Kimi K2.5。
集成： 使用我們的 OpenAI 兼容 API。探索 SiliconFlow API 文檔中的完整 API 規範。

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)