关于GLM-4.5V
作为GLM-V模型家族的一部分,GLM-4.5V基于智谱AI的基础模型GLM-4.5-Air,在图像、视频和文档理解以及GUI代理操作等任务上实现了SOTA性能。
发现GLM-4.5V的先进Multimodal推理如何在多种实际应用中推动创新解决方案。
Multimodal内容智能
从多种视觉和文本内容中,包括Image、Video和复杂文档中提取深入的见解,以进行全面分析和报告。
用例示例:
"自动总结制造业监控Video中的关键事件,并识别特定对象,生成用于质量控制的带时间戳的报告。"
智能GUI自动化
赋能AI代理与网页、桌面和移动界面互动,通过视觉理解和精确动作执行复杂任务。
用例示例:
"开发了一个代理,导航旧版Java ERP系统,提取特定订单详细信息,并将其输入到现代云物流平台中,减少了60%的人工处理时间。"
深度文档与图表分析
分析复杂的财务报告、科学论文和技术图纸,提取结构化数据,识别趋势,并生成详细摘要。
用例示例:
"处理了一篇150页的制药研究论文,从嵌入的图表和表格中提取关键实验结果,并总结药物的有效性和安全性,供监管审查。"
视觉质检与异常检测
通过视觉检查产品、生产线或数字资产,实现质量控制自动化,识别缺陷、不一致或标准偏差。
用例示例:
"通过高分辨率摄像头监控食品包装线,实时检测标签错误的产品和包装缺陷,防止不良产品到达消费者手中。"
元数据
规格
州
Deprecated
建筑
校准的
是
专家混合
是
总参数
106B
激活的参数
12B
推理
不
精度
FP8
上下文长度
66K
最大输出长度
66K
与其他模型进行比较
看看这个模型与其他模型相比表现如何。

Z.ai
chat
GLM-5
发行日期:2026年2月12日
上下文长度:
205K
最大输出长度:
131K
Input:
$
0.3
/ M Tokens
Output:
$
2.55
/ M Tokens

Z.ai
chat
GLM-4.7
发行日期:2025年12月23日
上下文长度:
205K
最大输出长度:
205K
Input:
$
0.42
/ M Tokens
Output:
$
2.2
/ M Tokens

Z.ai
chat
GLM-4.6V
发行日期:2025年12月8日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.3
/ M Tokens
Output:
$
0.9
/ M Tokens

Z.ai
chat
GLM-4.6
发行日期:2025年10月4日
上下文长度:
205K
最大输出长度:
205K
Input:
$
0.39
/ M Tokens
Output:
$
1.9
/ M Tokens

Z.ai
chat
GLM-4.5-Air
发行日期:2025年7月28日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.5V
发行日期:2025年8月13日
上下文长度:
66K
最大输出长度:
66K
Input:
$
0.14
/ M Tokens
Output:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.1V-9B-Thinking
发行日期:2025年7月4日
上下文长度:
66K
最大输出长度:
66K
Input:
$
0.035
/ M Tokens
Output:
$
0.14
/ M Tokens

Z.ai
chat
GLM-Z1-32B-0414
发行日期:2025年4月18日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

Z.ai
chat
GLM-4-32B-0414
发行日期:2025年4月18日
上下文长度:
33K
最大输出长度:
33K
Input:
$
0.27
/ M Tokens
Output:
$
0.27
/ M Tokens
