Kimi K2.5 現在SiliconFlowに登場:視覚的エージェントインテリジェンスにおける最先端技術

2026/02/04

目次

まとめ: Kimi K2.5 は現在SiliconFlowで利用可能です。これまでの最も強力なオープンソースモデルとして、最先端のコーディングとVision能力を組み合わせ、自己指向型エージェント群アーキテクチャを通じて、最大100のサブエージェントと1,500のツール呼び出しを調整することができます。この結果、単一エージェントの実行に比べて最大4.5倍の速度向上が実現します。能力によって強化されたK2.5は、Visionによるコーディング、エージェントワークフロー、現実世界のオフィス生産性シナリオ全体で強力なパフォーマンスをもたらします。最先端の視覚的エージェント知能を生産に持ち込むために、今すぐSiliconFlowのAPIを使用して構築を始めてください。

私たちは、Kimi K2.5SiliconFlow に導入し、開発者のための視覚的エージェント知能の新しい時代を開くことに興奮しています。約15Tの混合視覚とテキストtokensの継続的な事前トレーニングを通じてKimi K2の上に構築されており、ネイティブなMultimodalモデルとして最先端のコーディングとVision能力を提供します。K2.5はまた、事前定義された役割や手作りのワークフローを必要とせずに、最大100の特殊サブエージェントが並行ワークフローを最大1,500の調整ステップで実行できる自己指向型エージェント群のパラダイムを導入します。

今、SiliconFlowのKimi K2.5 APIを通じて、期待できます:

  • 競争力のある価格設定: Kimi K2.5: $0.55/M tokens (Input) と $3.0/M tokens (Output)

  • 262Kコンテキストウィンドウ: 長文文書、複雑な会話、および豊かな視覚的Inputsを持つ拡張マルチエージェントワークフローを処理します。

  • シームレスな統合: SiliconFlowのOpenAI互換APIを介して即座に展開するか、Claude CodeKilo CodeRoo CodeOpenClawなどとシームレスに統合します。

視覚的なプロンプトからインタラクティブなフロントエンドを構築したり、並行エージェントの実行による複雑な研究を行ったり、オフィスワークフローを自動化して専門レベルの文書やプレゼンテーションを生成したりする場合、SiliconFlowのKimi K2.5 APIは必要なパフォーマンスをもたらします。

以下のセクションでは、K2.5の主要な特徴を分解し、SiliconFlowのAPIを介して実際のタスクでのパフォーマンスを紹介し、ワークフローのパフォーマンスを最大化するための設定のヒントを提供します。

K2.5の新しい点

スクリーンショットからウェブサイトを再構築し、自然な会話を通じてコードを改善し、デザインモックアップをプロダクション準備のReactコンポーネントとアニメーションに変換する方法をご覧ください。市場分析を任された場合、100の専門研究者が1,500の調整ステップを並行して実行することができます。

今回、K2.5は3つの基本的な機能を提供します:

ネイティブなMultimodality

K2.5は視覚知識、クロスモーダル推論、視覚的Inputsに基づいたエージェントツールの利用において優れています。これは其の訓練における基本的な洞察に由来します:スケールにおいて、VisionとTextは競い合わず、互いに強化します。 初めから15TのVision-言語tokensで事前トレーニングされ、K2.5は見ることとコーディングを1つの統一されたスキルとして学びます。

Visionでのコーディング

それは単にImageを「見ている」のではありません—視覚的Inputsにわたって推論し、それらを直接プロダクション準備済みのコードに翻訳します。これまで最も強力なオープンソースモデルとして、特にフロントエンド開発においてK2.5は際立っています。 UIスクリーンショットを見せてレイアウトの問題をデバッグしたり、デザインモックアップをアップロードしてアニメーションとレスポンシブレイアウトを持つインタラクティブなReactコンポーネントを生成したりします。これにより、開発者が意図を表現する方法が根本的に変わり、そのバリアが低くなります:詳細な仕様を書く代わりに、視覚的にK2.5に何を求めるかを示すことができます。

プロンプト: ザラのウェブサイトの雰囲気がとても気に入っています(スクリーンショットが添付されています)—きれいでミニマリストなルックが素晴らしいタイポグラフィと滑らかなアニメーションであることを知って下さい。これに対し、私のデザイン作品のためのポートフォリオサイトを作りたいです。似たスタイルで何か作るのを手伝ってください。また、本当に重要なこととして、レイアウトが確固としたものであり、重ね合う要素や何か壊れていることがないようにしたいです。すべてが完全に機能し、開いたときにきれいに見えるようにしてください。

エージェント群

K2.5は単一エージェントのスケーリングから自己調整するエージェント群へとシフトし、専門的なエージェントによる並行サブタスクとして複雑なタスクを分解します。

実例: K2.5に100の専門職種の中でトップのYouTuberを3名特定するよう依頼します。オーケストレーターはまずこれら多様な領域—計算言語学から量子化学まで—を調査し定義します。そしてそれぞれの特定の分野を研究する100の専門サブエージェントを生成し、これらのエージェントは独立して並行にデータを収集し、コンテンツを作成します。その結果、300の詳細なYouTuberのプロフィールと統合されたレポートを、単一エージェントがかかる時間のほんの一部で提供します。

Moonshot AIの内部評価で、K2.5 Agent Swarmはエンドツーエンドの実行時間を80%削減しながらより複雑で長期のワークロードを可能にします。

ベンチマークパフォーマンス

Kimi K2.5はエージェントベンチマークで第1位にランクされ、その他の主要カテゴリーでもフロンティアレベルのパフォーマンスを達成し、GPT-5.2,Claude 4.5 Opus, と Gemini 3.0 Proと同等のカテゴリに位置づけられます。この包括的な能力は様々なワークフローにおける生産展開の準備が整っていることを示しています:

カテゴリー

ベンチマーク

Kimi K2.5

GPT-5.2 (xhigh)

Claude 4.5 Opus (拡張思考)

Gemini 3 pro
(高い思考レベル)

エージェント

HLE-Full

🥇50.2

45.5

43.2

45.8


BrowseComp

🥇74.9

65.8

57.8

59.2


DeepSearchQA

🥇77.1

71.3

76.1

63.2

コーディング

SWE-Bench Verified

76.8

80

80.9

76.2


SWE-Bench Multilingual

73

72

77.5

65

Image

MMMU Pro

78.5

79.5

74

81


MathVision

84.2

83

77.1

86.1


OmniDocBench 1.5

🥇88.8

85.7

87.7

88.5

Video

VideoMMMU

86.6

85.9

84.4

87.6


LongVideoBench

🥇79.8

76.5

67.2

77.7

そのリリース以来、Kimi K2.5はその他の評価分野でも波を立ててきました:

  • OSWorld (エージェント実行): 63.3%の成功率でClaude Sonnet 4.5 (62.9%)とSeed-1.8 (61.9%)を実際のコンピュータ環境タスクで上回り、第1位にランクされます。

  • DesignArena (UI生成): すべてのモデル中で最も高く、Gemini 3 Pro、Claude Opus 4.5、GLM-4.7を上回り、特に3Dデザイン、ウェブサイト作成、SVG生成タスクにおいて1349のスコアを達成します。

  • Vision Arena (Multimodal): Open-sourceモデル間で第1位にランクされ、総合で第6位となり、視覚的Inputsの理解と処理で(score 1249) GPT-5.1(1238)を上回っています。


お気に入りのツールでK2.5を使い始めましょう

Kimi K2.5は現在SiliconFlowで利用可能です。開発ワークフローに統合してください:

Kilo Code/Claude Code/Cline/Roo Code/ OpenClaw/SillyTavern/Kimi Code/Traeなどを通じて

APIアクセスを取得 →

ドキュメントを表示 →

K2.5設定のヒント

SiliconFlowでKimi K2.5から最高のパフォーマンスを得るために、以下の推奨設定に従ってください:

パラメーター

推奨

ノート

インスタントモード: 速い応答、日常のタスク

enable_thinking

FALSE

より速い応答のために推論プロセスを無効化します

temperature

0.6

一貫した焦点の定められたOutputに最適化されています

top_p

0.95

標準サンプリングパラメーター

思考モード: 深い推論、複雑な問題

enable_thinking

TRUE

ステップバイステップの推論が可能になります

temperature

1.0

複雑な推論のためのより高い創造性

top_p

0.95

標準サンプリングパラメーター

: VideoInputは現在試験的であり、MoonShotAIの公式APIによってのみサポートされています。

すぐに始めましょう

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)


AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow