GLM-4.5 Sekarang Tersedia di SiliconFlow: Model SOTA Sumber Terbuka untuk Aplikasi Penalaran, Kode, dan Agenik
28 Jul 2025
Daftar Isi
Hari ini, kami dengan gembira mengintegrasikan GLM-4.5 dan GLM-4.5-Air, seri model utama terbaru Z.ai, ke dalam platform SiliconFlow. Seri model inovatif ini mewakili tonggak penting dalam pengembangan AGI dengan secara alami menggabungkan kemampuan penalaran, pengkodean, dan agen ke dalam satu model untuk memenuhi kebutuhan yang semakin rumit dari aplikasi agen yang berkembang pesat.
Apakah Anda menangani proyek pengembangan full-stack, refaktorisasi kode yang canggih, atau membangun sistem agen otonom, GLM-4.5 menyediakan fungsionalitas lanjutan dan keandalan yang dibutuhkan aplikasi agen cerdas. Penambahan yang kuat ini ke katalog Model kami memberdayakan para pengembang untuk mendorong batas kemungkinan dalam otomatisasi cerdas dan skenario penyelesaian masalah yang kompleks.
Dengan API GLM-4.5 SiliconFlow, Anda dapat mengharapkan:
Harga yang Hemat Biaya: GLM-4.5 $0.5/M tokens (input) dan $2/M tokens (output); GLM-4.5-Air $0.14/M tokens (input) dan $0.86/M tokens (output).
Jendela Konteks yang Diperpanjang: Jendela konteks 128K untuk tugas-tugas kompleks.
Kemampuan Utama & Kinerja Tolok Ukur
Seri Model GLM-4.5 yang sekarang tersedia di SiliconFlow menampilkan kemampuan utama berikut:
Kinerja SOTA: Menyediakan hasil mutakhir di antara model open-source dalam penalaran, pembuatan kode, dan kemampuan agen, dengan kinerja terkemuka di industri dalam evaluasi agen kode dunia nyata.
Arsitektur MoE: GLM-4.5 memiliki total 355B/32B parameter aktif, sedangkan GLM-4.5-Air mengadopsi desain kompak dengan total 106B/12B parameter aktif. Keduanya memanfaatkan desain Mixture of Experts untuk efisiensi optimal.
Inference Hybrid: Keduanya menyediakan mode berpikir untuk tugas-tugas kompleks dan mode non-berpikir untuk respons langsung.
Untuk mengevaluasi secara komprehensif kemampuan umum GLM-4.5, Z.ai memilih 12 tolok ukur perwakilan yang mencakup tiga domain inti: penalaran (MMLU Pro, AIME 24, MATH 500), pengkodean (SciCode, GPQA, HLE, LiveCodeBench, SWE-Bench Verified), dan kemampuan agen (Terminal-Bench, TAU-Bench, BFCL v3, BrowseComp).
Di antara metrik-metrik ini, GLM-4.5 menunjukkan kinerja yang luar biasa:
Peringkat Global: Menduduki peringkat ke-3 secara global di antara semua model pada 12 tolok ukur komprehensif, mencetak 63,2 — hanya di belakang pemimpin Grok-4 (63,6) dan melampaui Claude 4 Opus (60,9).
Juara Open-Source: Model yang berprestasi tinggi di kategori open-source.
Domain Teknis: Menunjukkan keunggulan dalam penalaran matematis, pemecahan masalah ilmiah, pembuatan kode, alur kerja agen, dan eksekusi tugas yang kompleks.


Apa yang Membuat GLM-4.5 Begitu Kuat
Kerangka Pelatihan Lanjutan
Z.ai mengembangkan GLM-4.5 menggunakan proses tiga tahap yang canggih:
Pelatihan Awal: 15 triliun token dari data tujuan umum untuk kemampuan dasar.
Pelatihan Spesifik Domain: 8 triliun token berfokus pada tugas kode, penalaran, dan agen.
Pembelajaran Penguatan: Peningkatan kinerja dalam penalaran, pengkodean, dan alur kerja agen.
Efisiensi Parameter yang Superior
Melalui analisis Lengkung Pareto, GLM-4.5 menunjukkan efisiensi yang luar biasa:
Skala Optimal: Kinerja superior relatif terhadap model-model dengan skala yang sebanding.
Kepemimpinan Efisiensi: Mencapai efisiensi optimal pada batas pertukaran kinerja-skala.
Keuntungan Sumber Daya: Setengah parameter dari DeepSeek-R1, sepertiga dari Kimi-K2.
Manfaat Biaya: Efisiensi parameter yang lebih tinggi menghasilkan inference yang lebih cepat dan biaya operasional yang lebih rendah.

Kinerja Dunia Nyata
Di luar evaluasi tolok ukur, kemampuan praktis GLM-4.5 telah diuji secara ketat dalam skenario pengkodean dunia nyata:
Evaluasi Pengkodean Agen
Evaluasi independen dari kemampuan pengkodean agen GLM-4.5 dilakukan menggunakan Claude Code di 52 tugas pengkodean yang beragam, termasuk pengembangan frontend, pembuatan alat, analisis data, pengujian, dan implementasi algoritma.
Hasil Kompetitif:
vs. Kimi K2: Persentase kemenangan 53,9% dalam perbandingan langsung.
vs. Qwen3-Coder: Tingkat keberhasilan 80,8%, menunjukkan keunggulan yang jelas
vs. Claude-4-Sonnet: Kinerja yang kompetitif, meskipun optimasi lebih lanjut masih mungkin dilakukan
Akurasi Pemanggilan Alat: Tingkat keberhasilan terdepan 90,6%, melampaui Claude-4-Sonnet (89,5%), Kimi-K2 (86,2%), dan Qwen3-Coder (77,1%)


Skenario Aplikasi Nyata
Kemampuan GLM-4.5 meluas melampaui ukuran tolok ukur ke dalam skenario pengembangan praktis, menunjukkan keserbagunaan di berbagai domain melalui implementasi dunia nyata.
Pembuatan Artefak Interaktif
GLM-4.5 menciptakan artefak mandiri yang canggih—dari mini-game interaktif hingga simulasi fisika—dalam format HTML, SVG, Python, dan format lainnya, memberikan pengalaman pengguna yang superior untuk aplikasi pengkodean agen canggih.
Pembuatan Slide
Memanfaatkan penggunaan alat agen yang kuat dari GLM-4.5 dan kemampuan pengkodean HTML, agen PPT/Poster model-native secara otonom mencari di web, mengambil gambar, dan membuat slide dari permintaan sederhana atau dokumen yang diunggah.
Pengembangan Web Full-Stack
GLM-4.5 unggul dalam pengembangan frontend dan backend untuk aplikasi web modern. Pengguna dapat membuat seluruh situs web dengan beberapa kata, lalu dengan mudah menambahkan fitur melalui dialog multi-giliran, membuat proses pengkodean lancar dan menyenangkan.
Skenario dunia nyata ini menunjukkan utilitas praktis GLM-4.5 dalam alur kerja pengembangan profesional, dari pembuatan prototipe cepat hingga penyampaian aplikasi lengkap.
Mulai Sekarang Juga
Jelajahi: Cobalah GLM-4.5 & GLM-4.5-Air di Playground SiliconFlow.
Integrasikan: Gunakan API kami yang kompatibel dengan OpenAI. Jelajahi spesifikasi API lengkap di dokumentasi API SiliconFlow.
Bangun dengan API GLM-4.5 dan GLM-4.5-Air di SiliconFlow hari ini!

