State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

Z.ai

Text Generation

GLM-5

Dirilis pada: 12 Feb 2026

GLM-5 is a next-generation open-source model for complex systems engineering and long-horizon agentic tasks, scaled to ~744B sparse parameters (~40B active) with ~28.5T pretraining tokens. It integrates DeepSeek Sparse Attention (DSA) to retain long-context capacity while reducing inference cost, and leverages the “slime” asynchronous RL stack to deliver strong performance in reasoning, coding, and agentic benchmarks....

Total Context:

205K

Max output:

131K

Input:

$

0.3

/ M Tokens

Output:

$

2.55

/ M Tokens

Z.ai

Text Generation

GLM-4.7

Dirilis pada: 23 Des 2025

GLM-4.7 adalah Model unggulan generasi baru dari Zhipu, dengan total 355B parameter dan 32B parameter yang diaktifkan, memberikan peningkatan komprehensif dalam percakapan umum, penalaran, dan kemampuan agen. Respon menjadi lebih ringkas dan alami; penulisan terasa lebih imersif; instruksi panggilan alat diikuti dengan lebih andal; dan polesan front-end dari artefak dan pengkodean agen—bersama dengan efisiensi penyelesaian tugas jangka panjang—telah lebih ditingkatkan....

Total Context:

205K

Max output:

205K

Input:

$

0.42

/ M Tokens

Output:

$

2.2

/ M Tokens

Z.ai

Text Generation

GLM-4.6V

Dirilis pada: 8 Des 2025

GLM-4.6V mencapai akurasi SOTA (State-of-the-Art) dalam pemahaman visual di antara model dengan skala parameter yang sama. Untuk pertama kalinya, ini secara asli mengintegrasikan kemampuan Function Call ke dalam arsitektur model visual, menjembatani kesenjangan antara "Visual Perception" dan "Executable Action." Ini menyediakan dasar teknis yang terpadu untuk Agent Multimodal di skenario bisnis dunia nyata. Selain itu, jendela konteks visual telah diperluas menjadi 128k, mendukung pemrosesan aliran video panjang dan analisis multi-Image beresolusi tinggi....

Total Context:

131K

Max output:

131K

Input:

$

0.3

/ M Tokens

Output:

$

0.9

/ M Tokens

Z.ai

Text Generation

GLM-4.6

Dirilis pada: 4 Okt 2025

Dibandingkan dengan GLM-4.5, GLM-4.6 memberikan beberapa peningkatan kunci, termasuk jendela konteks yang lebih panjang yang diperluas hingga 200K tokens, kinerja pengkodean yang unggul, penalaran yang lebih canggih, agen yang lebih mampu, dan penulisan yang lebih halus....

Total Context:

205K

Max output:

205K

Input:

$

0.39

/ M Tokens

Output:

$

1.9

/ M Tokens

Z.ai

Text Generation

GLM-4.5-Air

Dirilis pada: 28 Jul 2025

Seri model GLM-4.5 adalah model dasar yang dirancang untuk agen cerdas. GLM-4.5-Air mengadopsi desain yang lebih kompak dengan total 106 miliar parameter dan 12 miliar parameter aktif. Ini juga merupakan model penalaran hibrida yang menyediakan mode berpikir dan mode non-berpikir....

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.86

/ M Tokens

Z.ai

Text Generation

GLM-4.5V

Dirilis pada: 13 Agu 2025

Sebagai bagian dari keluarga model GLM-V, GLM-4.5V didasarkan pada model dasar ZhipuAI, GLM-4.5-Air, mencapai kinerja SOTA pada tugas-tugas seperti Image, Video, dan pemahaman dokumen, serta operasi agen GUI....

Total Context:

66K

Max output:

66K

Input:

$

0.14

/ M Tokens

Output:

$

0.86

/ M Tokens

Z.ai

Text Generation

GLM-Z1-32B-0414

Dirilis pada: 18 Apr 2025

GLM-Z1-32B-0414 adalah Model penalaran dengan kemampuan berpikir mendalam. Model ini dikembangkan berdasarkan GLM-4-32B-0414 melalui cold start dan penguatan belajar berlanjut, serta pelatihan lebih lanjut pada tugas yang melibatkan matematika, kode, dan logika. Dibandingkan dengan Model dasar, GLM-Z1-32B-0414 secara signifikan meningkatkan kemampuan matematika dan kemampuan untuk menyelesaikan tugas-tugas kompleks. Selama proses pelatihan, tim juga memperkenalkan pembelajaran penguatan umum berdasarkan umpan balik peringkat berpasangan, yang semakin meningkatkan kemampuan umum Model ini. Meskipun hanya memiliki 32B parameter, kinerjanya pada tugas tertentu sebanding dengan DeepSeek-R1 dengan 671B parameter. Melalui evaluasi pada tolak ukur seperti AIME 24/25, LiveCodeBench, dan GPQA, Model ini menunjukkan kemampuan penalaran matematika yang kuat dan dapat mendukung solusi untuk berbagai tugas kompleks yang lebih luas....

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.57

/ M Tokens

Z.ai

Text Generation

GLM-4-32B-0414

Dirilis pada: 18 Apr 2025

GLM-4-32B-0414 adalah model generasi baru dalam keluarga GLM dengan 32 miliar parameter. Kinerjanya sebanding dengan seri GPT dari OpenAI dan seri V3/R1 dari DeepSeek, dan mendukung fitur deployment lokal yang sangat ramah pengguna. GLM-4-32B-Base-0414 dilatih sebelumnya pada 15T data berkualitas tinggi, termasuk sejumlah besar data sintetis tipe penalaran, yang menjadi dasar untuk pembelajaran penguatan ekstensi selanjutnya. Di tahap pasca-pelatihan, selain penyelarasan preferensi manusia untuk skenario dialog, tim memperkuat kinerja model dalam mengikuti instruksi, kode rekayasa, dan pemanggilan fungsi menggunakan teknik seperti penolakan sampling dan pembelajaran penguatan, memperkuat kemampuan atom yang diperlukan untuk tugas agen. GLM-4-32B-0414 mencapai hasil yang baik di bidang kode rekayasa, generasi Artefak, pemanggilan fungsi, Q&A berbasis pencarian, dan generasi laporan. Pada beberapa benchmark, kinerjanya mendekati atau bahkan melampaui model yang lebih besar seperti GPT-4o dan DeepSeek-V3-0324 (671B)...

Total Context:

33K

Max output:

33K

Input:

$

0.27

/ M Tokens

Output:

$

0.27

/ M Tokens

Z.ai

Text Generation

GLM-Z1-9B-0414

Dirilis pada: 18 Apr 2025

GLM-Z1-9B-0414 adalah model berukuran kecil dalam seri GLM dengan hanya 9 miliar parameter yang mempertahankan tradisi open-source sambil menampilkan kemampuan yang mengejutkan. Meskipun memiliki skala yang lebih kecil, GLM-Z1-9B-0414 tetap menunjukkan kinerja yang sangat baik dalam penalaran matematika dan tugas umum. Kinerja keseluruhannya sudah berada di tingkat terdepan di antara model-model open-source dengan ukuran yang sama. Tim penelitian menerapkan rangkaian teknik yang sama yang digunakan untuk model yang lebih besar untuk melatih model 9B ini. Terutama dalam skenario yang terbatas sumber dayanya, Model ini mencapai keseimbangan yang sangat baik antara efisiensi dan efektivitas, menyediakan opsi kuat bagi pengguna yang mencari penerapan yang ringan. Model ini memiliki kemampuan berpikir mendalam dan dapat menangani konteks yang panjang melalui teknologi YaRN, menjadikannya sangat cocok untuk aplikasi yang memerlukan kemampuan penalaran matematika dengan sumber daya komputasi yang terbatas....

Total Context:

131K

Max output:

131K

Input:

$

0.086

/ M Tokens

Output:

$

0.086

/ M Tokens

Z.ai

Text Generation

GLM-4-9B-0414

Dirilis pada: 18 Apr 2025

GLM-4-9B-0414 adalah model berukuran kecil dalam seri GLM dengan 9 miliar parameter. Model ini mewarisi karakteristik teknis dari seri GLM-4-32B tetapi menawarkan pilihan penerapan yang lebih ringan. Meskipun skalanya lebih kecil, GLM-4-9B-0414 tetap menunjukkan kemampuan yang luar biasa dalam pembuatan kode, desain web, pembuatan grafik SVG, dan tugas menulis berbasis pencarian. Model ini juga mendukung fitur pemanggilan fungsi, memungkinkan pemanggilan alat eksternal untuk memperluas jangkauan kemampuannya. Model ini menunjukkan keseimbangan yang baik antara efisiensi dan efektivitas dalam skenario yang terbatas sumber daya, memberikan opsi yang kuat bagi pengguna yang perlu menggunakan Model AI di bawah keterbatasan sumber daya komputasi. Seperti Model lainnya dalam seri yang sama, GLM-4-9B-0414 juga menunjukkan kinerja kompetitif dalam berbagai tes patokan....

Total Context:

33K

Max output:

33K

Input:

$

0.086

/ M Tokens

Output:

$

0.086

/ M Tokens

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow