
Z.ai
Text Generation
GLM-5
Выпуск: 12 февр. 2026 г.
GLM-5 is a next-generation open-source model for complex systems engineering and long-horizon agentic tasks, scaled to ~744B sparse parameters (~40B active) with ~28.5T pretraining tokens. It integrates DeepSeek Sparse Attention (DSA) to retain long-context capacity while reducing inference cost, and leverages the “slime” asynchronous RL stack to deliver strong performance in reasoning, coding, and agentic benchmarks....
Total Context:
205K
Max output:
131K
Input:
$
0.75
/ M Tokens
Output:
$
2.55
/ M Tokens

Z.ai
Text Generation
GLM-4.7
Выпуск: 23 дек. 2025 г.
GLM-4.7 — это новая флагманская модель компании Zhipu, с общим количеством параметров 355 миллиардов и 32 миллиарда активированных параметров, обеспечивающая комплексные обновления в области общих разговоров, рассуждений и возможностей агентов. Ответы стали более лаконичными и естественными; писательство ощущается более захватывающим; инструкции по вызову инструментов выполняются более надежно; и передний конечный блеск артефактов и агентского кодирования, вместе с эффективностью выполнения задач на большие расстояния, был дополнительно улучшен....
Total Context:
205K
Max output:
205K
Input:
$
0.42
/ M Tokens
Output:
$
2.2
/ M Tokens

Z.ai
Text Generation
GLM-4.6V
Выпуск: 8 дек. 2025 г.
Модель GLM-4.6V достигает SOTA (State-of-the-Art) точности в визуальном понимании среди моделей с такими же параметрами. Впервые в мире она встраивает возможности функциональных вызовов непосредственно в архитектуру визуальной модели, что позволяет устранить разрыв между «Визуальным восприятием» и «Исполнимым действием». Это предоставляет единую техническую основу для Multimodal агентов в реальных бизнес-сценариях. Кроме того, визуальное контекстное окно было расширено до 128k, поддерживая обработку длинных видеопотоков и анализ многократных изображений высокого разрешения....
Total Context:
131K
Max output:
131K
Input:
$
0.3
/ M Tokens
Output:
$
0.9
/ M Tokens

Z.ai
Text Generation
GLM-4.6
Выпуск: 4 окт. 2025 г.
По сравнению с GLM-4.5, GLM-4.6 вносит несколько ключевых улучшений, включая более длинное контекстное окно, расширенное до 200K tokens, улучшенную производительность кодирования, продвинутое умозаключение, более способных агентов и усовершенствованное написание....
Total Context:
205K
Max output:
205K
Input:
$
0.39
/ M Tokens
Output:
$
1.9
/ M Tokens

Z.ai
Text Generation
GLM-4.5-Air
Выпуск: 28 июл. 2025 г.
Серия моделей GLM-4.5 являются основными моделями, разработанными для интеллектуальных агентов. GLM-4.5-Air использует более компактный дизайн с 106 миллиардами общих параметров и 12 миллиардами активных параметров. Это также гибридная модель, обеспечивающая как режим мышления, так и режим без мышления....
Total Context:
131K
Max output:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.86
/ M Tokens

Z.ai
Text Generation
GLM-4.5V
Выпуск: 13 авг. 2025 г.
В рамках семейства моделей GLM-V, GLM-4.5V основан на базовой модели ZhipuAI GLM-4.5-Air, достигающей уровня SOTA в задачах, таких как Image, Video и документальное понимание, а также операции GUI-агентов....
Total Context:
66K
Max output:
66K
Input:
$
0.14
/ M Tokens
Output:
$
0.86
/ M Tokens

Z.ai
Text Generation
GLM-Z1-32B-0414
Выпуск: 18 апр. 2025 г.
GLM-Z1-32B-0414 — это модель рассуждения с глубокими возможностями мышления. Эта Model была разработана на основе GLM-4-32B-0414 через холодный старт и расширенное обучение с подкреплением, а также дальнейшее обучение на задачах, связанных с математикой, кодом и логикой. По сравнению с базовой Model, GLM-Z1-32B-0414 значительно улучшает математические способности и способность решать сложные задачи. В ходе тренировочного процесса команда также внедрила общее обучение с подкреплением на основе парных ранжированных отзывов, что еще больше улучшило общие возможности модели. Несмотря на то, что она имеет только 32B параметров, её производительность в некоторых задачах сопоставима с DeepSeek-R1 с 671B параметрами. В ходе оценок на таких тестах, как AIME 24/25, LiveCodeBench и GPQA, модель демонстрирует сильные математические способности к рассуждению и может поддерживать решения для более широкого спектра сложных задач....
Total Context:
131K
Max output:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

Z.ai
Text Generation
GLM-4-32B-0414
Выпуск: 18 апр. 2025 г.
GLM-4-32B-0414 — это модель нового поколения в семействе GLM с 32 миллиардами параметров. Её производительность сопоставима с серией GPT от OpenAI и серией V3/R1 от DeepSeek, а также она поддерживает очень удобные функции локального развертывания. GLM-4-32B-Base-0414 была предварительно обучена на 15 триллионах качественных данных, включая большое количество синтетических данных для рассуждений, что становится основой для последующих расширений обучения с подкреплением. На этапе пост-тренировки, помимо выравнивания по человеческим предпочтениям для сценариев диалогов, команда улучшила производительность Model в следовании инструкциям, инженерному коду и вызову функций с использованием таких технологий, как выборка отклонений и обучение с подкреплением, усиливая атомарные возможности, необходимые для агентских задач. GLM-4-32B-0414 достигает хороших результатов в таких областях, как инженерный код, генерация артефактов, вызовы функций, поисковые вопросы и ответы, а также генерация отчетов. На нескольких тестах её производительность приближается или даже превышает производительность более крупных моделей, таких как GPT-4o и DeepSeek-V3-0324 (671B)...
Total Context:
33K
Max output:
33K
Input:
$
0.27
/ M Tokens
Output:
$
0.27
/ M Tokens

Z.ai
Text Generation
GLM-Z1-9B-0414
Выпуск: 18 апр. 2025 г.
GLM-Z1-9B-0414 является малогабаритным Model в серии GLM, с всего лишь 9 миллиардами параметров, которая сохраняет традиции открытого исходного кода и демонстрирует удивительные возможности. Несмотря на ее меньший масштаб, GLM-Z1-9B-0414 все же демонстрирует отличную производительность в математических рассуждениях и общих задачах. Ее общая производительность уже находится на ведущем уровне среди открытых Model того же размера. Исследовательская группа использовала те же методы, что и для более крупных Model, для обучения этой 9B Model. Особенно в условиях ограниченности ресурсов эта Model достигает отличного баланса между эффективностью и результативностью, предоставляя мощный вариант для пользователей, ищущих легковесное развертывание. Model обладает способностями глубокого мышления и может обрабатывать длительные контексты благодаря технологии YaRN, что делает ее особенно подходящей для приложений, требующих математических рассуждений с ограниченными вычислительными ресурсами....
Total Context:
131K
Max output:
131K
Input:
$
0.086
/ M Tokens
Output:
$
0.086
/ M Tokens

Z.ai
Text Generation
GLM-4-9B-0414
Выпуск: 18 апр. 2025 г.
GLM-4-9B-0414 — это модель небольшого размера в серии GLM с 9 миллиардами параметров. Эта модель наследует технические характеристики серии GLM-4-32B, но предлагает более легкий вариант развертывания. Несмотря на меньший масштаб, GLM-4-9B-0414 по-прежнему демонстрирует отличные возможности в генерации кода, веб-дизайне, генерации SVG графики и задачах написания на основе поиска. Модель также поддерживает функции вызова функций, что позволяет ей вызывать внешние инструменты для расширения своих возможностей. Модель демонстрирует хорошее соотношение между эффективностью и результативностью в условиях ограниченных ресурсов, предоставляя мощный вариант для пользователей, которым необходимо развертывать AI модели при ограниченных вычислительных ресурсах. Как и другие модели в той же серии, GLM-4-9B-0414 также демонстрирует конкурентоспособную производительность в различных тестах на сравнение....
Total Context:
33K
Max output:
33K
Input:
$
0.086
/ M Tokens
Output:
$
0.086
/ M Tokens

