關於GLM-4.5V
作為GLM-V模型家族的一部分,GLM-4.5V基於智普AI的基礎模型GLM-4.5-Air,在圖像、視頻和文檔理解以及GUI代理操作等任務上達到最先進的性能。
探索 GLM-4.5V 的先進多模態推理如何為多樣的現實應用提供創新的解決方案。
多模態內容智慧
從各種視覺和文本內容中提取深層見解,包括圖像、視頻和複雜文件,以進行全面的分析和報告。
使用案例示例:
"自動摘要 30 分鐘製造監控視頻中的關鍵事件並識別特定對象,生成帶時間戳的質量控制報告。"
智能 GUI 自動化
使 AI 代理能夠與網頁、桌面和移動介面互動,通過視覺理解和精確操作執行複雜任務。
使用案例示例:
"開發了一個代理,能在基於 Java 的舊 ERP 系統中導航,提取特定訂單詳情並將其輸入現代雲端物流平台,減少了 60% 的手動處理時間。"
深度文件與圖表分析
分析複雜的財務報告、科學論文和技術示意圖,提取結構化數據、識別趨勢並生成詳細摘要。
使用案例示例:
"處理了一篇 150 頁的製藥研究論文,從嵌入的圖表和表格中提取關鍵實驗結果,並為監管審查總結藥物的療效和安全性。"
視覺 QA 與異常檢測
通過對產品、製造線或數字資產進行視覺檢查,自動化質量控制,識別缺陷、不一致性或與標準的偏差。
使用案例示例:
"通過高解析度攝像頭監控食品包裝線,即時檢測錯標商品和包裝缺陷,防止有缺陷的產品流入消費者。"
元數據
規格
狀態
Deprecated
架構
MoE Transformer
經過校準的
是
專家並行
是
總參數
106B
啟用的參數
12B
推理
否
精度
FP8
上下文長度
66K
最大輸出長度
66K
與其他模型比較
看看這個模型與其他模型的對比如何。

Z.ai
chat
GLM-5.1
發行日期:2026年4月3日
總上下文:
205K
最大輸出:
131K
輸入:
$
1.4
/ M Tokens
輸出:
$
4.4
/ M Tokens

Z.ai
chat
GLM-5V-Turbo
發行日期:2026年3月30日
總上下文:
205K
最大輸出:
131K
輸入:
$
1.2
/ M Tokens
輸出:
$
4.0
/ M Tokens

Z.ai
chat
GLM-5
發行日期:2026年2月12日
總上下文:
205K
最大輸出:
131K
輸入:
$
0.95
/ M Tokens
輸出:
$
2.55
/ M Tokens

Z.ai
chat
GLM-4.7
發行日期:2025年12月23日
總上下文:
205K
最大輸出:
205K
輸入:
$
0.42
/ M Tokens
輸出:
$
2.2
/ M Tokens

Z.ai
chat
GLM-4.6V
發行日期:2025年12月8日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.3
/ M Tokens
輸出:
$
0.9
/ M Tokens

Z.ai
chat
GLM-4.6
發行日期:2025年10月4日
總上下文:
205K
最大輸出:
205K
輸入:
$
0.39
/ M Tokens
輸出:
$
1.9
/ M Tokens

Z.ai
chat
GLM-4.5-Air
發行日期:2025年7月28日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.5V
發行日期:2025年8月13日
總上下文:
66K
最大輸出:
66K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
chat
GLM-4.1V-9B-Thinking
發行日期:2025年7月4日
總上下文:
66K
最大輸出:
66K
輸入:
$
0.035
/ M Tokens
輸出:
$
0.14
/ M Tokens
