关于GLM-4.6
与GLM-4.5相比,GLM-4.6带来了几个关键改进,包括将上下文窗口扩展到200K tokens、更优异的编码性能、先进的推理能力、更有能力的代理以及精炼的写作。
探索GLM-4.6的先进推理、卓越编码和广泛的200K上下文窗口如何解决复杂的现实世界挑战。
大规模代码库重构
分析大量代码库(例如,Python, Go),以实现架构改进、安全漏洞发现和整个项目的性能瓶颈优化。
用例示例:
"重构一个遗留的Python数据管道,识别冗余模块并建议优化的设计模式,将执行时间缩短25%。"
自主工作流程代理
设计和部署智能代理以自动化复杂的多步骤业务流程,集成各种工具和API,进行长上下文推理。
用例示例:
"开发了一个能够自主研究市场趋势的代理,使用金融API生成投资报告,并撰写高管摘要,减少了70%的研究时间。"
工程设计优化
通过模拟场景、分析性能数据、以及建议材料或结构改进来协助工程师优化复杂设计。
用例示例:
"通过模拟各种机翼几何形状和材料组合,优化了一款无人机的空气动力设计,提高了10%的飞行效率。"
法规合规审计
审核大量法律文件和法规框架,以识别合规差距、潜在风险并生成详细报告。
用例示例:
"审查150多页的GDPR条例与某公司的数据处理政策,对比发现7个重要的不合规问题并建议补救步骤。"
动态前端生成
从高级描述或线框图生成视觉精美且交互性的前端代码(例如,React, Vue),利用卓越编码技术。
用例示例:
"基于简单的Text提示和设计模型,以React创建了一个完全响应的电子商务产品页面,包括动态过滤和排序功能。"
元数据
规格
州
Deprecated
建筑
Transformer MoE
校准的
是
专家混合
是
总参数
335B
激活的参数
推理
不
精度
FP8
上下文长度
205K
最大输出长度
205K
与其他模型进行比较
看看这个模型与其他模型相比表现如何。

Z.ai
GLM-4.7
发行日期:2025年12月23日
上下文长度:
205K
最大输出长度:
205K
Input:
$
0.42
/ M Tokens
Output:
$
2.2
/ M Tokens

Z.ai
chat
GLM-4.6V
发行日期:2025年12月8日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.3
/ M Tokens
Output:
$
0.9
/ M Tokens

Z.ai
chat
GLM-4.6
发行日期:2025年10月4日
上下文长度:
205K
最大输出长度:
205K
Input:
$
0.39
/ M Tokens
Output:
$
1.9
/ M Tokens

Z.ai
chat
GLM-4.5-Air
发行日期:2025年7月28日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.5V
发行日期:2025年8月13日
上下文长度:
66K
最大输出长度:
66K
Input:
$
0.14
/ M Tokens
Output:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.1V-9B-Thinking
发行日期:2025年7月4日
上下文长度:
66K
最大输出长度:
66K
Input:
$
0.035
/ M Tokens
Output:
$
0.14
/ M Tokens

Z.ai
chat
GLM-Z1-32B-0414
发行日期:2025年4月18日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

Z.ai
chat
GLM-4-32B-0414
发行日期:2025年4月18日
上下文长度:
33K
最大输出长度:
33K
Input:
$
0.27
/ M Tokens
Output:
$
0.27
/ M Tokens

Z.ai
chat
GLM-Z1-9B-0414
发行日期:2025年4月18日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.086
/ M Tokens
Output:
$
0.086
/ M Tokens
