
Z.ai
Text Generation
GLM-5
發行日期:2026年2月12日
GLM-5 is a next-generation open-source model for complex systems engineering and long-horizon agentic tasks, scaled to ~744B sparse parameters (~40B active) with ~28.5T pretraining tokens. It integrates DeepSeek Sparse Attention (DSA) to retain long-context capacity while reducing inference cost, and leverages the “slime” asynchronous RL stack to deliver strong performance in reasoning, coding, and agentic benchmarks....
總上下文:
205K
最大輸出:
131K
輸入:
$
0.3
/ M Tokens
輸出:
$
2.55
/ M Tokens

Z.ai
Text Generation
GLM-4.7
發行日期:2025年12月23日
GLM-4.7 是智譜的新一代旗艦模型,擁有355B 總參數和32B 啟用參數,在一般對話、推理和代理能力方面進行了全面升級。回應更加簡潔自然;寫作感覺更具沉浸感;工具調用指令被更可靠地執行;文物和代理編碼的前端修飾——以及長期任務完成效率——進一步提高。...
總上下文:
205K
最大輸出:
205K
輸入:
$
0.42
/ M Tokens
輸出:
$
2.2
/ M Tokens

Z.ai
Text Generation
GLM-4.6V
發行日期:2025年12月8日
GLM-4.6V 在與相同參數規模的模型中,實現了視覺理解的 SOTA(State-of-the-Art)準確性。首次將功能調用能力本地整合到視覺模型架構中,彌合了「視覺感知」與「可執行行動」之間的鴻溝。這為現實商務場景中的多模態代理提供了統一的技術基礎。此外,視覺上下文窗口已擴展至 128k,支持長視頻流處理和高解析度多圖像分析。...
總上下文:
131K
最大輸出:
131K
輸入:
$
0.3
/ M Tokens
輸出:
$
0.9
/ M Tokens

Z.ai
Text Generation
GLM-4.6
發行日期:2025年10月4日
與GLM-4.5相比,GLM-4.6帶來了幾項關鍵改進,包括上下文窗口延展到200K token、更優異的編程性能、先進的推理能力、更高效的智能代理,以及更加精細的寫作。...
總上下文:
205K
最大輸出:
205K
輸入:
$
0.39
/ M Tokens
輸出:
$
1.9
/ M Tokens

Z.ai
Text Generation
GLM-4.5-Air
發行日期:2025年7月28日
GLM-4.5 系列模型是智能代理的基础模型。GLM-4.5-Air 采用更紧凑的设计,具有 1,060 亿个总参数和 120 亿个活动参数。它还是一种混合推理模型,提供思考模式和非思考模式。...
總上下文:
131K
最大輸出:
131K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
Text Generation
GLM-4.5V
發行日期:2025年8月13日
作為GLM-V模型家族的一部分,GLM-4.5V基於智普AI的基礎模型GLM-4.5-Air,在圖像、視頻和文檔理解以及GUI代理操作等任務上達到最先進的性能。...
總上下文:
66K
最大輸出:
66K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
Text Generation
GLM-Z1-32B-0414
發行日期:2025年4月18日
GLM-Z1-32B-0414 是一個具有深度思維能力的推理模型。該模型通過冷啟動和擴展增強學習,基於 GLM-4-32B-0414 開發,並在數學、代碼和邏輯任務上進一步訓練。與基礎模型相比,GLM-Z1-32B-0414 在數學能力和解決複雜任務的能力上有顯著提升。在訓練過程中,團隊還引入了基於成對排序反饋的一般增強學習,進一步提升了模型的綜合能力。儘管只有 32B 個參數,其在某些任務上的表現與具有 671B 個參數的 DeepSeek-R1 相媲美。通過在 AIME 24/25、LiveCodeBench 和 GPQA 等基準測試上的評估,該模型展示了強大的數學推理能力,能夠支持更廣泛的複雜任務解決方案...
總上下文:
131K
最大輸出:
131K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.57
/ M Tokens

Z.ai
Text Generation
GLM-4-32B-0414
發行日期:2025年4月18日
GLM-4-32B-0414 是 GLM 家族中一款新一代的模型,擁有 320 億個參數。其性能可與 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列相比,並支持非常用戶友好的本地部署功能。GLM-4-32B-Base-0414 在 15T 高品質數據上進行了預訓練,包括大量推理類型的合成數據,為後續的強化學習擴展奠定了基礎。在後期訓練階段,除了進行對話場景的人類偏好對齊外,團隊還通過拒絕取樣和強化學習等技術增強了模型在指令遵循、工程代碼和函數調用方面的性能,強化了代理任務所需的原子能力。GLM-4-32B-0414 在工程代碼、Artifact 生成、函數調用、基於搜索的問答和報告生成等領域取得了良好的效果。在多個基準測試中,其性能接近甚至超過較大模型如 GPT-4o 和 DeepSeek-V3-0324 (671B) 的表現。...
總上下文:
33K
最大輸出:
33K
輸入:
$
0.27
/ M Tokens
輸出:
$
0.27
/ M Tokens

Z.ai
Text Generation
GLM-Z1-9B-0414
發行日期:2025年4月18日
GLM-Z1-9B-0414 是 GLM 系列中的一個小型模型,只有 90 億個參數,保持了開放源代碼傳統,同時展示了令人驚訝的能力。儘管規模較小,GLM-Z1-9B-0414 在數學推理和一般任務中仍展現出優秀的性能。其整體性能已經在同尺寸的開放源代碼模型中處於領先水平。研究團隊使用與較大模型相同的技術系列來訓練這個 9B 模型。尤其在資源受限的情況下,這款模型在效率和效果之間達到了一個優秀的平衡,為尋求輕量化部署的用戶提供了一個強大的選擇。該模型具備深度思考能力,並且能夠通過 YaRN 技術處理長篇文段,特別適合需要有限計算資源的數學推理能力應用。...
總上下文:
131K
最大輸出:
131K
輸入:
$
0.086
/ M Tokens
輸出:
$
0.086
/ M Tokens

Z.ai
Text Generation
GLM-4-9B-0414
發行日期:2025年4月18日
GLM-4-9B-0414 是 GLM 系列中的小型模型,擁有 90 億參數。此模型繼承了 GLM-4-32B 系列的技術特徵,但提供了更輕量級的部署選項。儘管規模較小,GLM-4-9B-0414 在程式碼生成、網頁設計、SVG 圖形生成和基於搜索的寫作任務中仍展示出優異的能力。該模型還支持函數調用功能,允許它調用外部工具以擴展其能力範圍。模型在資源受限的場景中展現效率與效能之間的良好平衡,為需要在有限計算資源下部署 AI 模型的用戶提供了一個強大的選擇。與同系列的其他模型一樣,GLM-4-9B-0414 也在各種基準測試中展現出有競爭力的性能...
總上下文:
33K
最大輸出:
33K
輸入:
$
0.086
/ M Tokens
輸出:
$
0.086
/ M Tokens

