關於GLM-4.5
GLM-4.5系列模型是為智能代理設計的基礎模型,通過統一推理、編碼和智能代理能力來滿足智能代理應用的複雜需求。GLM-4.5擁有3550億個總參數和320億個活躍參數,提供思維模式和非思維模式兩種模式。
釋放智能代理的全部潛力,使用 GLM-4.5。其統一的推理、編碼和代理功能能夠為複雜的現實世界挑戰提供解決方案,利用深度'思考'和快速'非思考'模式。
自主代理協作
設計和部署能夠自我改進的代理,使用 GLM-4.5 的統一推理和編碼來計劃、執行和適應複雜任務。
使用案例示例:
"一個代理自主管理雲基礎設施,識別性能瓶頸,編寫 Python 腳本來擴展資源,並無需人工干預就部署修復。"
代理驅動的代碼重構
使代理能夠分析代碼庫,理解架構模式,並以高級推理進行複雜的重構或生成新模塊。
使用案例示例:
"一個代理將一個遺留的 Java 企業應用程序重構為現代的 Spring Boot 微服務,通過推理數據流和依賴性來優化模塊化和可擴展性。"
策略性商業智能
開發代理來合成多樣化的商業數據(報告、市場趨勢、客戶反饋),提供多方面的策略性建議並預測結果。
使用案例示例:
"一個代理分析季度財務報表、社交媒體情緒和競爭對手新聞,生成了一個新的產品市場進入策略,包括風險評估和預計的投資回報。"
自動系統設計與驗證
利用 GLM-4.5 設計健壯的系統架構,驗證組件間的邏輯一致性,並生成配置腳本以供部署。
使用案例示例:
"一個代理為一個高流量的電子商務平台設計了一個高韌性的 Kubernetes 部署,生成了 Helm 圖並驗證了網絡策略以確保安全性和可擴展性。"
動態知識綜合
創建代理能夠從龐大的知識庫中動態合成信息,解釋複雜概念,並根據用戶互動和推理調整學習路徑。
使用案例示例:
"一個代理為高級機器學習概念開發了一個個性化的學習模塊,從多篇研究論文中汲取知識並根據用戶的先前知識和問題調整解釋。"
元數據
規格
狀態
已棄用
架構
經過校準的
不
專家並行
是
總參數
335B
啟用的參數
32B
推理
不
精度
FP8
上下文長度
131K
最大輸出長度
與其他模型比較
看看這個模型與其他模型的對比如何。

Z.ai
聊天
GLM-4.7
發行日期:2025年12月23日
總上下文:
205K
最大輸出:
205K
輸入:
$
0.42
/ M Tokens
輸出:
$
2.2
/ M Tokens

Z.ai
聊天
GLM-4.6V
發行日期:2025年12月8日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.3
/ M Tokens
輸出:
$
0.9
/ M Tokens

Z.ai
聊天
GLM-4.6
發行日期:2025年10月4日
總上下文:
205K
最大輸出:
205K
輸入:
$
0.39
/ M Tokens
輸出:
$
1.9
/ M Tokens

Z.ai
聊天
GLM-4.5-Air
發行日期:2025年7月28日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
聊天
GLM-4.5V
發行日期:2025年8月13日
總上下文:
66K
最大輸出:
66K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
聊天
GLM-4.1V-9B-Thinking
發行日期:2025年7月4日
總上下文:
66K
最大輸出:
66K
輸入:
$
0.035
/ M Tokens
輸出:
$
0.14
/ M Tokens

Z.ai
聊天
GLM-Z1-32B-0414
發行日期:2025年4月18日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.57
/ M Tokens

Z.ai
聊天
GLM-4-32B-0414
發行日期:2025年4月18日
總上下文:
33K
最大輸出:
33K
輸入:
$
0.27
/ M Tokens
輸出:
$
0.27
/ M Tokens

Z.ai
聊天
GLM-Z1-9B-0414
發行日期:2025年4月18日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.086
/ M Tokens
輸出:
$
0.086
/ M Tokens
