GLM-Z1-32B-0414

GLM-Z1-32B-0414

THUDM/GLM-Z1-32B-0414

정보에 대해서GLM-Z1-32B-0414

GLM-Z1-32B-0414은 깊이 있는 사고 능력을 가진 추론 Model입니다. 이 Model은 GLM-4-32B-0414를 기반으로 콜드 스타트와 강화 학습을 통해 개발되었으며, 수학, 코드 및 논리를 포함한 작업에 대한 추가 훈련이 이루어졌습니다. 기본 Model에 비해 GLM-Z1-32B-0414은 수학적 능력과 복잡한 작업을 해결하는 능력이 크게 향상되었습니다. 훈련 과정에서 팀은 쌍비교 순위 피드백에 기반한 일반 강화 학습도 도입하여 Model의 일반적인 능력을 더욱 향상시켰습니다. 32B 파라미터만 가졌음에도 불구하고, 특정 작업에서의 성능은 671B 파라미터를 가진 DeepSeek-R1과 비교할 만합니다. AIME 24/25, LiveCodeBench, GPQA와 같은 벤치마크에 대한 평가를 통해, 이 Model은 강력한 수학적 추론 능력을 보여주며, 더 넓은 범위의 복잡한 작업에 대한 솔루션을 지원할 수 있습니다.

사용 가능한 Serverless

쿼리를 즉시 실행하고 사용한 만큼만 지불하세요.

$

0.14

/

$

0.57

1M 토큰당 (Input/Output)

메타데이터

생성하다

2025. 4. 18.

라이센스

MIT

공급자

Z.ai

허깅페이스

사양

Available

건축

교정된

아니요

전문가의 혼합

아니요

총 매개변수

32B

활성화된 매개변수

32B

추론

아니요

Precision

FP8

콘텍스트 길이

131K

Max Tokens

131K

지원됨 기능

Serverless

지원됨

Serverless LoRA

지원하지 않음

Fine-tuning

지원하지 않음

Embedding

지원하지 않음

Rerankers

지원하지 않음

지원 Image Input

지원하지 않음

JSON Mode

지원됨

구조화된 Outputs

지원하지 않음

도구

지원됨

Fim Completion

지원하지 않음

Chat Prefix Completion

지원하지 않음

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow