GLM-Z1-32B-0414

GLM-Z1-32B-0414

THUDM/GLM-Z1-32B-0414

關於GLM-Z1-32B-0414

GLM-Z1-32B-0414 是具有深度思考能力的推理模型。此模型是基於 GLM-4-32B-0414 通過冷啟動和擴展強化學習開發的,並在涉及數學、代碼和邏輯的任務上進行進一步訓練。與基礎模型相比,GLM-Z1-32B-0414 在數學能力和解決複雜任務的能力上有顯著提高。在訓練過程中,團隊還引入了基於成對排序反饋的一般強化學習,進一步增強了模型的通用能力。儘管只有 32B 的參數,但其在某些任務上的表現可與擁有 671B 參數的 DeepSeek-R1 相媲美。通過在 AIME 24/25、LiveCodeBench、和 GPQA 等基準上的評估,該模型展現了強大的數學推理能力,可以支持更廣泛複雜任務的解決方案。

可用的無伺服器

立即運行查詢,僅按使用量付費

$

0.14

$

0.57

每百萬 Tokens(輸入/輸出)

元數據

創建於

2025年4月18日

許可證

MIT

供應商

Z.ai

HuggingFace

規格

狀態

可用

架構

經過校準的

專家並行

總參數

32B

啟用的參數

32B

推理

精度

FP8

上下文長度

131K

最大輸出長度

131K

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

不支持

JSON 模式

支持

結構化輸出

不支持

工具

支持

中間填充補全

不支持

聊天前綴補全

不支持

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow