關於GLM-4.6
與GLM-4.5相比,GLM-4.6帶來了幾項關鍵改進,包括上下文窗口延展到200K token、更優異的編程性能、先進的推理能力、更高效的智能代理,以及更加精細的寫作。
探索 GLM-4.6 的先進推理、卓越編碼和廣泛的 200K 上下文視窗如何解決複雜的現實世界挑戰。
大規模代碼庫重構
分析龐大的代碼庫(例如,Python,Go)以獲得架構改進、安全漏洞和整個項目的性能瓶頸。
使用案例示例:
"重構了一個遺留的Python數據管道,識別冗餘模塊並建議優化的設計模式,將執行時間縮短了25%。"
自主工作流程代理
設計和部署智能代理來自動化複雜的多步驟業務流程,整合各種工具和API,配合長期上下文推理。
使用案例示例:
"開發了一個自主調查市場趨勢的代理,使用金融API生成投資報告,並撰寫執行摘要,減少研究時間70%。"
工程設計優化
協助工程師通過模擬場景、分析性能數據和建議材料或結構改進來優化複雜設計。
使用案例示例:
"通過模擬不同的翼面幾何和材料組成,優化了無人機的空氣動力學設計,提高了10%的飛行效率。"
法規合規性審計
審計大量法律文件和法規框架,以識別合規性差距、潛在風險並生成詳細報告。
使用案例示例:
"審查了150多頁的GDPR法規,對比公司的數據處理政策,標記了7個關鍵的非合規問題並建議補救措施。"
動態前端生成
從高級描述或線框生成視覺完美和交互式的前端代碼(例如,React,Vue),利用卓越的編碼能力。
使用案例示例:
"根據簡單的文字提示和設計模型,創建了一個完全響應的電子商務產品頁面(使用React),包括動態篩選和排序功能。"
元數據
規格
狀態
Deprecated
架構
Transformer MoE
經過校準的
是
專家並行
是
總參數
335B
啟用的參數
推理
否
精度
FP8
上下文長度
205K
最大輸出長度
205K
與其他模型比較
看看這個模型與其他模型的對比如何。

Z.ai
chat
GLM-5.1
發行日期:2026年4月3日
總上下文:
205K
最大輸出:
131K
輸入:
$
1.4
/ M Tokens
輸出:
$
4.4
/ M Tokens

Z.ai
chat
GLM-5V-Turbo
發行日期:2026年3月30日
總上下文:
205K
最大輸出:
131K
輸入:
$
1.2
/ M Tokens
輸出:
$
4.0
/ M Tokens

Z.ai
chat
GLM-5
發行日期:2026年2月12日
總上下文:
205K
最大輸出:
131K
輸入:
$
0.95
/ M Tokens
輸出:
$
2.55
/ M Tokens

Z.ai
chat
GLM-4.7
發行日期:2025年12月23日
總上下文:
205K
最大輸出:
205K
輸入:
$
0.42
/ M Tokens
輸出:
$
2.2
/ M Tokens

Z.ai
chat
GLM-4.6V
發行日期:2025年12月8日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.3
/ M Tokens
輸出:
$
0.9
/ M Tokens

Z.ai
chat
GLM-4.6
發行日期:2025年10月4日
總上下文:
205K
最大輸出:
205K
輸入:
$
0.39
/ M Tokens
輸出:
$
1.9
/ M Tokens

Z.ai
chat
GLM-4.5-Air
發行日期:2025年7月28日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.5V
發行日期:2025年8月13日
總上下文:
66K
最大輸出:
66K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.1V-9B-Thinking
發行日期:2025年7月4日
總上下文:
66K
最大輸出:
66K
輸入:
$
0.035
/ M Tokens
輸出:
$
0.14
/ M Tokens
