최신식

AI 모델 라이브러리

하나의 API로 200개 이상의 최첨단 AI Models에서 Inference를 실행하고 몇 초 만에 배포할 수 있습니다

최신식

AI 모델 라이브러리

하나의 API로 200개 이상의 최첨단 AI Models에서 Inference를 실행하고 몇 초 만에 배포할 수 있습니다

최신식

AI 모델 라이브러리

하나의 API로 200개 이상의 최첨단 AI Models에서 Inference를 실행하고 몇 초 만에 배포할 수 있습니다

Z.ai

Text Generation

GLM-5

출시일: 2026. 2. 12.

GLM-5 is a next-generation open-source model for complex systems engineering and long-horizon agentic tasks, scaled to ~744B sparse parameters (~40B active) with ~28.5T pretraining tokens. It integrates DeepSeek Sparse Attention (DSA) to retain long-context capacity while reducing inference cost, and leverages the “slime” asynchronous RL stack to deliver strong performance in reasoning, coding, and agentic benchmarks....

Total Context:

205K

Max output:

131K

Input:

$

0.3

/ M Tokens

Output:

$

2.55

/ M Tokens

Z.ai

Text Generation

GLM-4.7

출시일: 2025. 12. 23.

GLM-4.7은 Zhipu의 차세대 플래그십 Model로, 총 355B 파라미터와 32B 활성화 파라미터를 가지고 있으며, 일반 대화, 추론 및 에이전트 기능에서 종합적인 업그레이드를 제공합니다. 응답은 더 간결하고 자연스러워졌으며, 글쓰기에서는 더욱 몰입감을 느낄 수 있습니다. 도구 호출 지침도 더 신뢰할 수 있게 따르며, 인공물의 프론트엔드 마감 처리와 에이전트 코드의 효과성, 장기간 과제 완료 효율성도 더욱 개선되었습니다....

Total Context:

205K

Max output:

205K

Input:

$

0.42

/ M Tokens

Output:

$

2.2

/ M Tokens

Z.ai

Text Generation

GLM-4.6V

출시일: 2025. 12. 8.

GLM-4.6V는 동일한 매개변수 규모의 모델 중 시각적 이해에서 SOTA (State-of-the-Art) 정확도를 달성합니다. 처음으로, 시각적 모델 아키텍처에 Function Call 기능을 본질적으로 통합하여 "시각적 인식"과 "실행 가능한 행동" 간의 격차를 해소합니다. 이는 실제 비즈니스 시나리오에서 다중 모달 에이전트를 위한 통합된 기술적 기반을 제공합니다. 또한, 시각적 컨텍스트 창이 128k로 확장되어 긴 비디오 스트림 처리와 고해상도 멀티 이미지 분석을 지원합니다....

Total Context:

131K

Max output:

131K

Input:

$

0.3

/ M Tokens

Output:

$

0.9

/ M Tokens

Z.ai

Text Generation

GLM-4.6

출시일: 2025. 10. 4.

GLM-4.5와 비교하여 GLM-4.6은 몇 가지 주요 개선 사항을 가져옵니다. 여기에는 길이가 200K token으로 확장된 더 긴 문맥 창, 뛰어난 코딩 성능, 고급 추론, 더 강력한 에이전트, 그리고 정교한 글쓰기가 포함됩니다....

Total Context:

205K

Max output:

205K

Input:

$

0.39

/ M Tokens

Output:

$

1.9

/ M Tokens

Z.ai

Text Generation

GLM-4.5-Air

출시일: 2025. 7. 28.

GLM-4.5 시리즈 모델은 지능형 에이전트를 위해 설계된 기본 Model입니다. GLM-4.5-Air는 총 1060억 매개변수와 120억 활성 매개변수를 갖춘 더 컴팩트한 디자인을 채택하고 있습니다. 또한, 사고 모드와 비사고 모드를 모두 제공하는 하이브리드 추론 모델입니다....

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.86

/ M Tokens

Z.ai

Text Generation

GLM-4.5V

출시일: 2025. 8. 13.

GLM-V 계열 모델의 일부인 GLM-4.5V는 ZhipuAI의 기본 모델 GLM-4.5-Air를 기반으로 하여 이미지, 비디오 및 문서 이해와 같은 작업에서 SOTA 성능을 달성하고 GUI 에이전트 작업도 수행합니다....

Total Context:

66K

Max output:

66K

Input:

$

0.14

/ M Tokens

Output:

$

0.86

/ M Tokens

Z.ai

Text Generation

GLM-Z1-32B-0414

출시일: 2025. 4. 18.

GLM-Z1-32B-0414은 깊이 있는 사고 능력을 가진 추론 Model입니다. 이 Model은 GLM-4-32B-0414를 기반으로 콜드 스타트와 강화 학습을 통해 개발되었으며, 수학, 코드 및 논리를 포함한 작업에 대한 추가 훈련이 이루어졌습니다. 기본 Model에 비해 GLM-Z1-32B-0414은 수학적 능력과 복잡한 작업을 해결하는 능력이 크게 향상되었습니다. 훈련 과정에서 팀은 쌍비교 순위 피드백에 기반한 일반 강화 학습도 도입하여 Model의 일반적인 능력을 더욱 향상시켰습니다. 32B 파라미터만 가졌음에도 불구하고, 특정 작업에서의 성능은 671B 파라미터를 가진 DeepSeek-R1과 비교할 만합니다. AIME 24/25, LiveCodeBench, GPQA와 같은 벤치마크에 대한 평가를 통해, 이 Model은 강력한 수학적 추론 능력을 보여주며, 더 넓은 범위의 복잡한 작업에 대한 솔루션을 지원할 수 있습니다....

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.57

/ M Tokens

Z.ai

Text Generation

GLM-4-32B-0414

출시일: 2025. 4. 18.

GLM-4-32B-0414는 320억 개의 매개변수를 가진 GLM 계열의 차세대 모델입니다. 그 성능은 OpenAI의 GPT 시리즈와 DeepSeek의 V3/R1 시리즈에 필적하며, 매우 사용자 친화적인 로컬 배포 기능을 지원합니다. GLM-4-32B-Base-0414는 15조 바이트의 고품질 데이터, 대량의 추론형 합성 데이터를 포함하여 사전 훈련되어 후속 강화 학습 확장의 기반을 마련했습니다. 사후 훈련 단계에서는 대화 시나리오에 대한 인간의 선호 정렬 외에도 팀은 거절 샘플링 및 강화 학습과 같은 기술을 사용하여 지침 준수, 엔지니어링 코드 및 함수 호출에서 모델의 성능을 강화했습니다. GLM-4-32B-0414는 엔지니어링 코드, 아티팩트 생성, 함수 호출, 검색 기반 Q&A, 보고서 생성 등 다양한 분야에서 우수한 결과를 달성합니다. 여러 벤치마크에서 성능은 때로는 GPT-4o나 DeepSeek-V3-0324 (671B)와 같은 더 큰 모델의 성능에 근접하거나 이를 초과하기도 합니다....

Total Context:

33K

Max output:

33K

Input:

$

0.27

/ M Tokens

Output:

$

0.27

/ M Tokens

Z.ai

Text Generation

GLM-Z1-9B-0414

출시일: 2025. 4. 18.

GLM-Z1-9B-0414는 90억 개의 매개변수를 가진 소형 크기의 Model로, 오픈 소스 전통을 유지하면서도 놀라운 기능을 보여주는 GLM 시리즈의 일원입니다. 그 규모가 작음에도 불구하고, GLM-Z1-9B-0414는 수학적 추론 및 일반 작업에서 뛰어난 성능을 발휘합니다. 그 전반적인 성능은 동급 오픈 소스 Model들 중에서 이미 선두 수준에 있습니다. 연구팀은 더 큰 Model에 사용된 동일한 기술 시리즈를 사용하여 이 9B Model을 훈련시켰습니다. 특히 자원이 제한된 시나리오에서 이 Model은 효율성과 효과성 간의 탁월한 균형을 달성하여 경량 배포를 원하는 사용자에게 강력한 옵션을 제공합니다. 이 Model은 깊은 사고 능력을 갖추고 있으며, YaRN 기술을 통해 긴 문맥을 처리할 수 있어, 제한된 계산 자원으로 수학적 추론 능력이 필요한 응용 프로그램에 특히 적합합니다....

Total Context:

131K

Max output:

131K

Input:

$

0.086

/ M Tokens

Output:

$

0.086

/ M Tokens

Z.ai

Text Generation

GLM-4-9B-0414

출시일: 2025. 4. 18.

GLM-4-9B-0414는 GLM 시리즈의 소형 모델로, 90억 개의 파라미터를 가지고 있습니다. 이 Model은 GLM-4-32B 시리즈의 기술적 특성을 계승하면서도 더 가벼운 배포 옵션을 제공합니다. 규모가 작음에도 불구하고, GLM-4-9B-0414는 코드 생성, 웹 디자인, SVG 그래픽 생성 및 검색 기반 작성 작업에서 뛰어난 능력을 발휘합니다. 이 Model은 또한 함수 호출 기능을 지원하여 외부 도구를 호출해서 기능 범위를 확장할 수 있습니다. 이 Model은 자원 제한 시나리오에서 효율성과 효과성 사이의 좋은 균형을 보여주어, 제한된 계산 자원 하에서 AI 모델을 배치해야 하는 사용자에게 강력한 옵션을 제공합니다. 같은 시리즈의 다른 모델들과 마찬가지로 GLM-4-9B-0414도 다양한 벤치마크 테스트에서 경쟁력 있는 성능을 보여줍니다....

Total Context:

33K

Max output:

33K

Input:

$

0.086

/ M Tokens

Output:

$

0.086

/ M Tokens

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow