Kimi K2.5 現在在 SiliconFlow 上:視覺代理智能的SOTA

2026年2月4日

目錄

總結: Kimi K2.5 現在在 SiliconFlow 上可用。作為迄今為止最強大的開源 Model,它將最先進的編碼和 Vision 能力與自主的Agent Swarm架構結合起來,能夠協調多達 100 個子代理和 1,500 個工具調用。這使得單代理執行加速多達 4.5 倍。K2.5 借助能力提供了在編碼與 Vision、代理工作流程及現實辦公生產力場景中強大的表現。立即開始使用 SiliconFlow 的 API 構建,將最先進的視覺代理智能投入生產。

我們很高興能將 Kimi K2.5 帶到 SiliconFlow

,為全球開發者開啟視覺代理智能的新時代。通過對< a id="6">Kimi K2進行持續預訓練,涵蓋約 15T 混合視覺和 Text tokens ,它作為本地 Multimodal Model 提供了最先進的編碼和 Vision 能力。K2.5 還引入了一種自主的 Agent Swarm 範式,可以協調多達 100 個專業化的子代理,執行多達 1,500 步的並行工作流程,無需預定義角色或手工製作的工作流程。


<,為全球開發者開啟視覺代理智能的新時代。通過對>

現在,通過 SiliconFlow 的 Kimi K2.5 API,您可以期待:

  • 競爭力的定價: Kimi K2.5: $0.55/百萬 tokens (Input) 和 $3.0/百萬 tokens (Output)

  • 262K 範圍窗口: 處理長文檔、複雜對話以及具有豐富視覺輸入的擴展多代理工作流程。

  • 無縫集成: 通過 SiliconFlow 的 OpenAI 兼容 API 即刻部署,或無縫集成到 Claude CodeKilo CodeRoo CodeOpenClaw 等系統中。

無論您是在從事互動前端建構、使用並行代理執行進行複雜研究,還是自動化辦公工作流程以生成專家級文檔和演示文稿,SiliconFlow 的 Kimi K2.5 API 都能提供您所需的性能。

接下來的章節中,我們將分解 K2.5 的關鍵功能,展示它如何通過 SiliconFlow 的 API 在真實世界任務中運行,並提供配置技巧以最大化您的工作流程性能。

K2.5 的新特性

看看它是如何從單個截圖中重建網站,通過自然對話改進代碼,並將設計稿轉化為生產就緒的 React 組件並附帶動畫的。當進行市場分析時,它可以協調 100 名專業研究人員並行執行 1,500 步協調的步驟。

這一次,K2.5 提供了三個基本特點:

本地 Multimodality

K2.5 在視覺知識、跨模態推理和基於視覺 Input 的代理工具使用方面表現出色——能力來自於訓練中一項基本見解:大規模時,Vision 和 Text 不是競爭,而是相互強化。 從視覺-語言 15T tokens 出發進行預訓練,K2.5 學會將「看」和「編碼」作為一種統一的技能。

與 Vision 合作編碼

它不僅僅是「看見」 Image ——而是基於視覺 Input 進行推理,並直接將其轉化為生產就緒的代碼。作為迄今為止最強的開源 Model,K2.5 尤其在前端開發中表現出色。向它展示 UI 截圖以調試佈局問題,或上傳設計樣本,以生成具有動畫和響應式佈局的互動 React 組件。這從根本上改變了開發者表達意圖的方式並降低了門檻:與其寫下詳細規範,不如直觀展示你所需。

提示:嘿,我真的很喜歡 Zara 網站的整體風格(截圖附上)——你知道的,乾淨、極簡主義的外觀,字體排版和流暢動畫都很好。與此同時,我想為我的設計作品建一個作品集網站。你能幫我創建一些相似風格的嗎?另外,真的很重要,我想確保佈局穩固,沒有重疊元素或損壞。打開時應該全部功能正常,並且看起來乾淨。

Agent Swarm

K2.5 從單一代理擴展轉向自主協調的 Agent Swarm——將複雜任務分解為由專業代理執行的並行子任務。

工作方式如下:命令 K2.5 識別 100 個專業領域中的前三名 YouTuber。調度器先研究並界定這些多元領域——從計算語言學到量子化學一應俱全。然後它生成 100 個專業子代理,每個代理負責研究一個特定領域。這些代理並行工作,獨立收集數據和分析內容創作者。結果?300 個完整的 YouTuber 檔案和一份綜合報告——比單一代理耗時要少得多。

在 Moonshot AI 的內部評估中,K2.5 Agent Swarm 使端到端運行時間縮短了 80%,同時使更複雜的長期工作負載成為可能,如下所示。

基準表現


Kimi K2.5 在<強>代理基準測試中排名#1,在其他主要類別中也達到了前沿水平,使其與 GPT-5.2Claude 4.5 OpusGemini 3.0 Pro 併列。這一綜合能力使其可在不同工作流程中投入生產部署:


類別

基準

Kimi K2.5

GPT-5.2 (xhigh)

Claude 4.5 Opus (extended thinking)

Gemini 3 pro
(high thinking-level)

代理

HLE-Full

🥇50.2

45.5

43.2

45.8


BrowseComp

🥇74.9

65.8

57.8

59.2


DeepSearchQA

🥇77.1

71.3

76.1

63.2

編碼

SWE-Bench 已驗證

76.8

80

80.9

76.2


SWE-Bench 多語言

73

72

77.5

65

Image

MMMU Pro

78.5

79.5

74

81


MathVision

84.2

83

77.1

86.1


OmniDocBench 1.5

🥇88.8

85.7

87.7

88.5

Video

VideoMMMU

86.6

85.9

84.4

87.6


LongVideoBench

🥇79.8

76.5

67.2

77.7

自發行以來,Kimi K2.5 也在其他評估場中處於領先地位:

  • OSWorld(代理執行):以 63.3% 的成功率排名#1,超過 Claude Sonnet 4.5(62.9%)和 Seed-1.8(61.9%)在真實計算機環境任務上的表現。

  • DesignArena(UI 生成):以 1349 分——所有 Model 中最高,超過 Gemini 3 Pro、Claude Opus 4.5 和 GLM-4.7。K2.5 在 3D 設計、網站創建和 SVG 生成任務中表現尤為出色。

  • Vision Arena(Multimodal):在開源 Model 中排名#1,總體排名第 6,以 1249 分領先於 GPT-5.1(1238)在理解和處理視覺輸入方面。


立即開始在您喜愛的工具中使用 K2.5

Kimi K2.5 現在在 SiliconFlow 上可用。將其集成到您的開發工作流程中,通過:

Kilo Code/Claude Code/Cline/Roo Code/ OpenClaw/SillyTavern/Kimi Code/Trae 和更多

獲取 API 訪問 →

查看文檔 →

K2.5 配置提示

要在 SiliconFlow 上獲得 Kimi K2.5 的最佳性能,請遵循以下推薦設置:

參數

推薦

注意事項

即時模式:快速響應,日常任務

enable_thinking

FALSE

禁用推理過程以獲得更快響應

temperature

0.6

優化為一致、專注的輸出

top_p

0.95

標準採樣參數

思考模式:深思熟慮,複雜問題

enable_thinking

TRUE

啟用逐步推理

temperature

1.0

更高的創造力以應對複雜推理

top_p

0.95

標準採樣參數

注意:Video Input 目前處於實驗階段,僅 MoonShotAI 的官方 API 支持。

立即開始

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)


準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow