關於GLM-4.1V-9B-Thinking
GLM-4.1V-9B-Thinking 是一個開源的視覺語言模型 (VLM),由智譜AI和清華大學的KEG實驗室聯合發布,旨在推進通用多模態推理。在GLM-4-9B-0414基礎模型的基礎上構建,它引入了一種“思考範式”並利用課程採樣增強學習 (RLCS) 來顯著提升其在複雜任務中的能力。作為一個9B參數模型,它在類似規模的模型中達到最先進的性能,其性能可媲美甚至超越了在18項不同基準上更大的72B參數Qwen-2.5-VL-72B。該模型在多樣化的任務中表現突出,包括STEM問題解決、影片理解和長文檔理解,並且能夠處理高達4K分辨率和任意長寬比的圖像。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.035
/
$
0.14
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
可用
架構
經過校準的
不
專家並行
不
總參數
9B
啟用的參數
9B
推理
不
精度
FP8
上下文長度
66K
最大輸出長度
66K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
支持
JSON 模式
不支持
結構化輸出
不支持
工具
不支持
中間填充補全
不支持
聊天前綴補全
不支持
與其他模型比較
看看這個模型與其他模型的對比如何。

Z.ai
聊天
GLM-4.7
發行日期:2025年12月23日
總上下文:
205K
最大輸出:
205K
輸入:
$
0.42
/ M Tokens
輸出:
$
2.2
/ M Tokens

Z.ai
聊天
GLM-4.6V
發行日期:2025年12月8日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.3
/ M Tokens
輸出:
$
0.9
/ M Tokens

Z.ai
聊天
GLM-4.6
發行日期:2025年10月4日
總上下文:
205K
最大輸出:
205K
輸入:
$
0.39
/ M Tokens
輸出:
$
1.9
/ M Tokens

Z.ai
聊天
GLM-4.5-Air
發行日期:2025年7月28日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
聊天
GLM-4.5V
發行日期:2025年8月13日
總上下文:
66K
最大輸出:
66K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.86
/ M Tokens

Z.ai
聊天
GLM-4.1V-9B-Thinking
發行日期:2025年7月4日
總上下文:
66K
最大輸出:
66K
輸入:
$
0.035
/ M Tokens
輸出:
$
0.14
/ M Tokens

Z.ai
聊天
GLM-Z1-32B-0414
發行日期:2025年4月18日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.14
/ M Tokens
輸出:
$
0.57
/ M Tokens

Z.ai
聊天
GLM-4-32B-0414
發行日期:2025年4月18日
總上下文:
33K
最大輸出:
33K
輸入:
$
0.27
/ M Tokens
輸出:
$
0.27
/ M Tokens

Z.ai
聊天
GLM-Z1-9B-0414
發行日期:2025年4月18日
總上下文:
131K
最大輸出:
131K
輸入:
$
0.086
/ M Tokens
輸出:
$
0.086
/ M Tokens
