GLM-4.5 現在可在 SiliconFlow 上使用:用於推理、編程和代理應用的開源 SOTA 模型

2025年7月28日

目錄

GLM-4.5 現已在 SiliconFlow 上可用
GLM-4.5 現已在 SiliconFlow 上可用

今天,我們很高興將GLM-4.5GLM-4.5-Air,Z.ai最新的旗艦模型系列,整合到SiliconFlow平台中。這一突破性的模型系列在AGI開發中代表著一個重要的里程碑,通過本地化地統一推理、編程和代理能力,進一步滿足快速增長的代理應用中越來越複雜的需求。

無論您是在進行全堆疊開發項目、複雜的代碼重構,還是構建自動代理系統,GLM-4.5提供了智能代理應用所需的先進功能和可靠性。這一強大的模型目錄添加使開發者能夠在智能自動化和複雜問題解決場景中突破可能性的界限。

使用SiliconFlow的GLM-4.5 API,您可以期望:

  • 具成本效益的定價:GLM-4.5 $0.5/M tokens(輸入)和$2/M tokens(輸出);GLM-4.5-Air $0.14/M tokens(輸入)和$0.86/M tokens(輸出)。

  • 擴展的上下文窗口: 128K上下文窗口,用於複雜任務。

關鍵能力與基準性能

現可在SiliconFlow上使用的GLM-4.5模型系列具有以下關鍵能力:

  • SOTA性能:在推理、代碼生成和代理能力方面提供開源模型中的最先進結果,並在實際代碼代理評估中領先行業性能。

  • MoE架構:GLM-4.5總計擁有355B參數/32B活躍參數,而GLM-4.5-Air採用了緊湊設計,擁有106B總計/12B活躍參數。兩者都利用專家混合設計以達到最佳效率。

  • 混合推理:均提供複雜任務的思維模式和即時回應的非思維模式。

為全面評估GLM-4.5的普通能力,Z.ai選擇了12個代表性的基準,覆蓋三個核心領域:推理(MMLU Pro, AIME 24, MATH 500)、編程(SciCode, GPQA, HLE, LiveCodeBench, SWE-Bench Verified)、和代理能力(Terminal-Bench, TAU-Bench, BFCL v3, BrowseComp)。

在這些綜合指標中,GLM-4.5顯示出卓越的性能:

  • 全球排名在所有模型中排名全球第三,在12個綜合基準中得分63.2——僅次於領先的Grok-4 (63.6),超過Claude 4 Opus (60.9)。

  • 開源冠軍:在開源類別中表現最佳的模型。

  • 技術領域:在數學推理、科學問題解決、代碼生成、代理工作流程和複雜任務執行方面表現出色。

GLM-4.5如此強大的原因

高級訓練管道

Z.ai使用複雜的三階段過程開發GLM-4.5:

  • 預訓練:15萬億個令牌的一般用途數據,用於基礎能力。

  • 領域特定訓練:8萬億個令牌,專注於代碼、推理和代理任務。

  • 強化學習:在推理、編碼和代理工作流程中提高性能。

卓越的參數效率

通過Pareto Frontier分析,GLM-4.5表現出卓越的效率:

  • 最佳擴展:相較於可比規模的模型,表現優越。

  • 效率領導力:在性能-規模均衡邊界上達到最佳效率。

  • 資源優勢:是DeepSeek-R1的參數的一半,Kimi-K2的三分之一。

  • 成本效益:更高的參數效率轉化為更快的推理和更低的運營成本。

實際世界性能

除了基準評估之外,GLM-4.5的實際能力在實際代碼場景中經過嚴格測試:

代理編碼評估

GLM-4.5的代理編碼能力通過Claude Code獨立評估,涵蓋包括前端開發、工具創建、數據分析、測試和算法實現的52個多樣化編碼任務。

競爭結果:

  • VS. Kimi K2:頭對頭比較中53.9%的勝率。

  • VS. Qwen3-Coder:80.8%的成功率,顯示出明顯的優勢

  • VS. Claude-4-Sonnet:表現競爭性,但進一步優化仍有可能

  • 工具調用準確性:領先的90.6%成功率,超過Claude-4-Sonnet (89.5%)、Kimi-K2 (86.2%)和Qwen3-Coder (77.1%)

實際應用場景

GLM-4.5的能力超越了基準,進入了實際的開發場景,通過現實世界的實施展示了跨多個領域的多功能性。

互動構件創建

GLM-4.5創建從互動小遊戲到物理模擬的複雜獨立構件——跨HTML、SVG、Python和其他格式,為高級代理編碼應用提供卓越的用戶體驗。

幻燈片創建

利用GLM-4.5強大的代理工具使用和HTML編碼能力,模型原生PPT/海報代理自主搜索網頁、檢索圖片,並從簡單的請求或上傳的文檔創建幻燈片。

全棧網絡開發

GLM-4.5在現代Web應用的前端和後端開發中表現出色。用戶可以輕鬆創建整個網站,然後通過多次對話輕鬆添加功能,使编码過程順利且愉快。

這些現實世界的場景展示GLM-4.5在專業開發工作流程中的實用性,從快速原型到完整應用交付。

立即開始

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "zai-org/GLM-4.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "top_p": 0.95,
    "temperature": 0.6
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

今天就在SiliconFlow上使用GLM-4.5和GLM-4.5-Air API進行構建!

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow