シリコンフロー上で考える Kimi K2: 思考し行動するエージェント

2025/11/17

目次

要約: Kimi K2 Thinking が今、SiliconFlow、Moonshot AIの最新で最も先進的なオープンソース思考Modelで利用可能です。推論エージェントとして設計されており、段階的に思考し、200-300 回の連続したツール呼び出しを人間の介入なしで実行でき、数百のステップにわたって一貫して推論して複雑な問題を解決します。推論エージェント検索コーディングライティング、および一般的な能力において優れています。Kimi K2 Thinkingを使用して、OpenAI/Anthropic互換のAPIを利用して、エージェントやワークフローにシームレスに統合できます。


私たちは、Kimi K2 ThinkingMoonshot AIの最も先進的なオープンソース思考ModelをSiliconFlowで利用できることを歓迎しています。従来の推論Modelが単に考えるだけなのとは異なり、考えて行動します。検索、コード、データツールなど、最大300回のツール呼び出しを自律的に連結して、複雑な問題をエンドツーエンドで解決します。これは、推論の深さとエージェントの能力の両方を同時に拡張して問題解決力を新しいレベルに引き上げる、Moonshotのテストタイムスケーリングのブレークスルーを示しています。

SiliconFlowのKimi K2 Thinking APIでは、次のことが期待できます:

  • 予算に優しい価格設定: Kimi K2 Thinking $1.1/M tokens(Input)と$4.5/M tokens(Output)。

  • 262Kコンテキストウィンドウ: 長文ドキュメント、複雑な推論、及び拡張されたエージェントタスクに最適。

  • GPT-5とClaude Sonnet 4.5を上回るパフォーマンス: 主要な推論、コーディング、及びエージェントベンチマーク全体で。

推論エージェント、コーディングコパイロット、または研究アシスタントを構築する場合でも、Kimi K2 ThinkingはSiliconFlowのOpenAI/Anthropic互換APIを通じてアクセス可能で、既存のワークフローに簡単に接続できます。


主な機能


SiliconFlowで利用可能なKimi K2 Thinkingには、次の主要な機能があります:

  • 深い思考とツールのオーケストレーション: 理解-推論のチェーンを関数呼び出しと組み合わせて、数百のステップにわたってドリフトすることなく持続する自律的な研究、コーディング、ライティングワークフローを可能にします。たとえば、インタラクティブなビジュアルシミュレーションを構築する際には、ツール呼び出しを調整して、上位の指示を実行可能なコードに変換します。これにより、複雑な開発タスクでの自動化と信頼性が大幅に向上します。


  • プロダクションレディな速度: ネイティブINT4量子化により、品質を損なうことなく2倍のInference速度を実現。数百の操作を含むタスクを実行する際に重要です。

  • 長時間のセッションに対する信頼性: 順次行動を通じて柔軟な推論サイクルに適応します。 計画 → 推論 → 実行 → 適応 → 改良。30-50のステップ後に集中を切らす典型的なModelとは異なり、複雑な問題を明確なサブタスクに分解し、エンドツーエンドのワークフローを完了します。

  • 強力な一般ライティング: 創造的、分析的、及びパーソナライズされたライティングを一貫した論理、鮮明なディテールで処理し、スタイルを損なわずにスムーズに適応します。


ベンチマークパフォーマンス


Kimi K2 Thinkingは、推論、コーディング、およびエージェントの能力を評価するベンチマーク全体で新記録を樹立し、GPT-5Claude Sonnet 4.5 などの先進的なModelを上回ります:

  • エージェント推論: HLEで44.9%を達成、100以上のテーマにおける何千もの専門家レベルの質問の厳しいベンチマーク。

  • エージェントコーディング: SWE-Bench Verifiedで71.3%SWE-Multilingualで61.1%を獲得し、プログラミング言語とエージェントスキャフォールド全般で強力な一般化を示し、HTML、React、コンポーネント集約的なフロントエンドタスクでも顕著な改善を提供します。

  • エージェント検索とブラウジング: BrowseCompで60.2%を達成、人間の基準29.2%の2倍。


ベンチマーク

Kimi K2 Thinking

GPT-5(高)

Claude Sonnet 4.5(Thinking)

高度な推論

人類の最後の試験

(Textのみでツールの結果)

🥇44.9%

41.7%

32.0%

エージェントのウェブブラウジング

BrowseComp

🥇60.2%

54.9%

24.1%

複雑な情報検索推論

SEAL-0

🥇56.3%

51.4%

53.4%

エージェントコーディング

SWE-Multilingual

61.1%

55.3%

68.0%

SWE-bench Verified

71.3%

74.9%

77.2%

競技プログラミング

LiveCodeBench V6

83.1%

87.0%

64.0%


開発者向けの統合


Kimi K2 Thinkingの業界をリードするパフォーマンスを超えて、SiliconFlowは既存の開発エコシステムとの即時互換性を提供します:

  • OpenAI互換ツール: ClineQwen CodeGen-CLI、およびその他の標準開発環境とシームレスに統合します—SiliconFlow APIキーをプラグインするだけです。

  • Anthropic互換API: Claude Codeや、コードレビュー、デバッグ、構造改善のためのAnthropic互換ツールと連携します。

  • プラットフォーム統合: DifyChatHubChatboxSiderMindSearchDB-GPT

ですぐに使用でき<、またOpenRouterを通じて入手可能です。


<ですぐに使用でき>

強力なModel、シームレスな統合、およびコスト効率の高い価格設定により、SiliconFlowは構築方法を革命的に変え、高速に出荷し、スマートにスケーリングします。


すぐに始めましょう


  1. 探索する: Kimi K2 ThinkingSiliconFlow Playgroundでお試しください。

  2. 統合する: OpenAI互換APIを使用してください。SiliconFlow API ドキュメントで完全なAPI仕様を確認してください。


import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2-Thinking",
    "messages": [
        {
            "role": "user",
            "content": "Please provide information about a person in the following JSON format: {   \"name\": \"string\",   \"age\": \"number\",   \"occupation\": \"string\",   \"hobbies\": [\"string\"] }  Generate a realistic example."
        }
    ],
    "max_tokens": 4096,
    "stop": "1",
    "temperature": 0.7,
    "response_format": {"type": "json_object"}
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow