Современный

Библиотека моделей ИИ

Один API для запуска Inference на более чем 200 передовых AI Models и развертывания за считанные секунды

Современный

Библиотека моделей ИИ

Один API для запуска Inference на более чем 200 передовых AI Models и развертывания за считанные секунды

Современный

Библиотека моделей ИИ

Один API для запуска Inference на более чем 200 передовых AI Models и развертывания за считанные секунды

Z.ai

Text Generation

GLM-5

Выпуск: 12 февр. 2026 г.

GLM-5 is a next-generation open-source model for complex systems engineering and long-horizon agentic tasks, scaled to ~744B sparse parameters (~40B active) with ~28.5T pretraining tokens. It integrates DeepSeek Sparse Attention (DSA) to retain long-context capacity while reducing inference cost, and leverages the “slime” asynchronous RL stack to deliver strong performance in reasoning, coding, and agentic benchmarks....

Total Context:

205K

Max output:

131K

Input:

$

0.75

/ M Tokens

Output:

$

2.55

/ M Tokens

Z.ai

Text Generation

GLM-4.7

Выпуск: 23 дек. 2025 г.

GLM-4.7 — это новая флагманская модель компании Zhipu, с общим количеством параметров 355 миллиардов и 32 миллиарда активированных параметров, обеспечивающая комплексные обновления в области общих разговоров, рассуждений и возможностей агентов. Ответы стали более лаконичными и естественными; писательство ощущается более захватывающим; инструкции по вызову инструментов выполняются более надежно; и передний конечный блеск артефактов и агентского кодирования, вместе с эффективностью выполнения задач на большие расстояния, был дополнительно улучшен....

Total Context:

205K

Max output:

205K

Input:

$

0.42

/ M Tokens

Output:

$

2.2

/ M Tokens

Z.ai

Text Generation

GLM-4.6V

Выпуск: 8 дек. 2025 г.

Модель GLM-4.6V достигает SOTA (State-of-the-Art) точности в визуальном понимании среди моделей с такими же параметрами. Впервые в мире она встраивает возможности функциональных вызовов непосредственно в архитектуру визуальной модели, что позволяет устранить разрыв между «Визуальным восприятием» и «Исполнимым действием». Это предоставляет единую техническую основу для Multimodal агентов в реальных бизнес-сценариях. Кроме того, визуальное контекстное окно было расширено до 128k, поддерживая обработку длинных видеопотоков и анализ многократных изображений высокого разрешения....

Total Context:

131K

Max output:

131K

Input:

$

0.3

/ M Tokens

Output:

$

0.9

/ M Tokens

Z.ai

Text Generation

GLM-4.6

Выпуск: 4 окт. 2025 г.

По сравнению с GLM-4.5, GLM-4.6 вносит несколько ключевых улучшений, включая более длинное контекстное окно, расширенное до 200K tokens, улучшенную производительность кодирования, продвинутое умозаключение, более способных агентов и усовершенствованное написание....

Total Context:

205K

Max output:

205K

Input:

$

0.39

/ M Tokens

Output:

$

1.9

/ M Tokens

Z.ai

Text Generation

GLM-4.5-Air

Выпуск: 28 июл. 2025 г.

Серия моделей GLM-4.5 являются основными моделями, разработанными для интеллектуальных агентов. GLM-4.5-Air использует более компактный дизайн с 106 миллиардами общих параметров и 12 миллиардами активных параметров. Это также гибридная модель, обеспечивающая как режим мышления, так и режим без мышления....

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.86

/ M Tokens

Z.ai

Text Generation

GLM-4.5V

Выпуск: 13 авг. 2025 г.

В рамках семейства моделей GLM-V, GLM-4.5V основан на базовой модели ZhipuAI GLM-4.5-Air, достигающей уровня SOTA в задачах, таких как Image, Video и документальное понимание, а также операции GUI-агентов....

Total Context:

66K

Max output:

66K

Input:

$

0.14

/ M Tokens

Output:

$

0.86

/ M Tokens

Z.ai

Text Generation

GLM-Z1-32B-0414

Выпуск: 18 апр. 2025 г.

GLM-Z1-32B-0414 — это модель рассуждения с глубокими возможностями мышления. Эта Model была разработана на основе GLM-4-32B-0414 через холодный старт и расширенное обучение с подкреплением, а также дальнейшее обучение на задачах, связанных с математикой, кодом и логикой. По сравнению с базовой Model, GLM-Z1-32B-0414 значительно улучшает математические способности и способность решать сложные задачи. В ходе тренировочного процесса команда также внедрила общее обучение с подкреплением на основе парных ранжированных отзывов, что еще больше улучшило общие возможности модели. Несмотря на то, что она имеет только 32B параметров, её производительность в некоторых задачах сопоставима с DeepSeek-R1 с 671B параметрами. В ходе оценок на таких тестах, как AIME 24/25, LiveCodeBench и GPQA, модель демонстрирует сильные математические способности к рассуждению и может поддерживать решения для более широкого спектра сложных задач....

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.57

/ M Tokens

Z.ai

Text Generation

GLM-4-32B-0414

Выпуск: 18 апр. 2025 г.

GLM-4-32B-0414 — это модель нового поколения в семействе GLM с 32 миллиардами параметров. Её производительность сопоставима с серией GPT от OpenAI и серией V3/R1 от DeepSeek, а также она поддерживает очень удобные функции локального развертывания. GLM-4-32B-Base-0414 была предварительно обучена на 15 триллионах качественных данных, включая большое количество синтетических данных для рассуждений, что становится основой для последующих расширений обучения с подкреплением. На этапе пост-тренировки, помимо выравнивания по человеческим предпочтениям для сценариев диалогов, команда улучшила производительность Model в следовании инструкциям, инженерному коду и вызову функций с использованием таких технологий, как выборка отклонений и обучение с подкреплением, усиливая атомарные возможности, необходимые для агентских задач. GLM-4-32B-0414 достигает хороших результатов в таких областях, как инженерный код, генерация артефактов, вызовы функций, поисковые вопросы и ответы, а также генерация отчетов. На нескольких тестах её производительность приближается или даже превышает производительность более крупных моделей, таких как GPT-4o и DeepSeek-V3-0324 (671B)...

Total Context:

33K

Max output:

33K

Input:

$

0.27

/ M Tokens

Output:

$

0.27

/ M Tokens

Z.ai

Text Generation

GLM-Z1-9B-0414

Выпуск: 18 апр. 2025 г.

GLM-Z1-9B-0414 является малогабаритным Model в серии GLM, с всего лишь 9 миллиардами параметров, которая сохраняет традиции открытого исходного кода и демонстрирует удивительные возможности. Несмотря на ее меньший масштаб, GLM-Z1-9B-0414 все же демонстрирует отличную производительность в математических рассуждениях и общих задачах. Ее общая производительность уже находится на ведущем уровне среди открытых Model того же размера. Исследовательская группа использовала те же методы, что и для более крупных Model, для обучения этой 9B Model. Особенно в условиях ограниченности ресурсов эта Model достигает отличного баланса между эффективностью и результативностью, предоставляя мощный вариант для пользователей, ищущих легковесное развертывание. Model обладает способностями глубокого мышления и может обрабатывать длительные контексты благодаря технологии YaRN, что делает ее особенно подходящей для приложений, требующих математических рассуждений с ограниченными вычислительными ресурсами....

Total Context:

131K

Max output:

131K

Input:

$

0.086

/ M Tokens

Output:

$

0.086

/ M Tokens

Z.ai

Text Generation

GLM-4-9B-0414

Выпуск: 18 апр. 2025 г.

GLM-4-9B-0414 — это модель небольшого размера в серии GLM с 9 миллиардами параметров. Эта модель наследует технические характеристики серии GLM-4-32B, но предлагает более легкий вариант развертывания. Несмотря на меньший масштаб, GLM-4-9B-0414 по-прежнему демонстрирует отличные возможности в генерации кода, веб-дизайне, генерации SVG графики и задачах написания на основе поиска. Модель также поддерживает функции вызова функций, что позволяет ей вызывать внешние инструменты для расширения своих возможностей. Модель демонстрирует хорошее соотношение между эффективностью и результативностью в условиях ограниченных ресурсов, предоставляя мощный вариант для пользователей, которым необходимо развертывать AI модели при ограниченных вычислительных ресурсах. Как и другие модели в той же серии, GLM-4-9B-0414 также демонстрирует конкурентоспособную производительность в различных тестах на сравнение....

Total Context:

33K

Max output:

33K

Input:

$

0.086

/ M Tokens

Output:

$

0.086

/ M Tokens

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Russian (Russia)
Russian (Russia)
Russian (Russia)