より深く考え、より速く行動する: Qwen3-235B-A22B-Thinking-2507 が SiliconFlow で利用可能になりました

2025/07/31

目次

より深く考え、より速く行動する: Qwen3-235B-A22B-Thinking-2507 が SiliconFlow で利用可能になりました
より深く考え、より速く行動する: Qwen3-235B-A22B-Thinking-2507 が SiliconFlow で利用可能になりました

すでにSiliconFlowで卓越したパフォーマンスを示しているQwen3-235B-A22B-Instruct-2507 (Non-Thinking mode)に加え、今日はモデルカタログに次のブレークスルーをお届けします:Qwen3-235B-A22B-Thinking-2507です。この新しいオープンソースモデルは、推論性能と一般知能の両方で卓越した進歩を遂げ、Gemini-2.5 ProやO4-miniなどの代表的な独自モデルと同等の能力を持ち、オープンソースAIの新しいパフォーマンスベンチマークを確立しています。

高度な研究分析から複雑なコード生成に至るまで、開発者は複雑な問題解決タスクに対する前例のない推論性能にアクセスすることができます。

SiliconFlowのQwen3-235B-A22B-Thinking-2507 APIによって、次のことが期待できます:

  • コスト効率の高い価格設定: $0.35/M tokens (Input) と $1.42/M tokens (Output)。

  • 拡張されたコンテキストウィンドウ: 複雑なタスクのための256Kコンテキストウィンドウ。

主要な能力とベンチマークパフォーマンス

以前のオープンソースモデルDeepSeek-R1-0528と比較して、Qwen3-235B-A22B-Thinking-2507は実用的な能力において大幅な改善を示しています:

  • SOTA推論性能: 大幅に改善された論理推論、数学、科学、コーディング、学術的ベンチマークが必要な人間の専門知識を通常必要とする分野で、オープンソースの思考モデルの中で最先端の結果を達成します。

  • 拡張された一般機能: より良い指示遵守、ツール使用、テキスト生成、および人間の好みに合わせた調整。

  • 拡張された長期コンテキスト理解: 強化された256K長期コンテキスト理解能力。

これらの能力は、複数の業界標準ベンチマークにわたるモデルの強力でバランスの取れたパフォーマンスに反映されています。

その結果、LiveCodeBench v6およびArena-Hard v2すべての比較モデルの中で最初にランクインし、優れたコーディング能力と人間の好みに合った調整を示しています。AIME25では、92.3を達成し、Gemini-2.5 Pro (88.0)を上回り、O4-mini (92.7)に匹敵する、先進的な数学的推論を示しています。

ベンチマーク

Qwen3-235B-A22B-Thinking-2507

Gemini-2.5 Pro

O4-mini

DeepSeek-R1-0528

GPQA
(一般知識)

81.1

86.4

81.4

81

AIME25
(数学的推論)

92.3

88

92.7

87.5

LiveCodeBench v6
(コード生成)

🥇74.1

72.5

71.8

68.7

HLE
(シミュレートされた人間の判断)

18.2

21.6

18.1

17.7

Arena-Hard v2
(マルチターンアライメント)

🥇79.7

72.5

59.3

72.2

これらの結果は、Qwen3-235B-A22B-Thinking-2507がこれまでで最も有能なオープンソースモデルの一つであることを示しており、先進的なプロプライエタリシステムに対しても競争力のある性能を持っていることを示しています。

実際のアプリケーションシナリオ

SiliconFlowで今すぐ利用可能なQwen3-235B-A22B-Thinking-2507は、長期コンテキスト理解を備えた強化された思考能力を特徴としています。

  • ヘルスケアインテリジェンス

医学文献の分析、臨床意思決定支援、患者記録や研究データベースから得られる精密医療の洞察。遺伝的変異、薬物相互作用および治療プロトコルの分析。診断支援、研究証拠の統合、個別化治療計画に最適。

  • 教育強化

複雑なSTEM主題のインタラクティブチュータリング、プログラミング指導、および個別学習デザイン。個々の学習スタイルおよび認知ニーズに合わせて説明やステップバイステップガイダンスを適応させます。 高度な数学、コーディングブートキャンプ、研究方法論のトレーニングに最適。

  • ビジネス文書インテリジェンス

契約、技術仕様書、規制提出書類の文書分析と文脈的クロスリファレンス。主要な洞察の抽出、コンプライアンスリスクの特定、および経営者向けサマリーの生成。 法的文書の見直し、デューデリジェンス、知識管理システムに適しています。

すぐに開始できます

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-235B-A22B-Thinking-2507",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

高度な推論機能を解除する準備はできていますか?

今すぐSiliconFlowでQwen3-235B-A22B-Thinking-2507を探索してください。

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow