8 Wawasan Kunci tentang Infrastruktur AI dari salah satu pendiri SiliconFlow

14 Nov 2025

Daftar Isi

Pan Yang, co-founder dari SiliconFlow, menyampaikan pidato berjudul "AI Infra: Untuk Siapa dan Mengapa?" pada “Real-Time AI Infra Session” dari Convo AI & RTE 2025. Ada 8 wawasan inti ke dalam bidang AI Infra.

Ringkasan

8 wawasan kunci dari pidato Pan Yang tentang Infrastruktur AI:

  1. Inference First — Peralihan menuju komputasi inferensi didorong oleh pertumbuhan eksponensial pelanggan AI dan kebutuhan komputasi.

  2. Peluang Open-Source — Model open-source mengejar ketertinggalan dalam selang waktu 3–5 bulan, dengan potensi terobosan di area multimodal.

  3. Panggilan untuk MaaS — Platform all-in-one menyediakan akses API tunggal ke beberapa model.

  4. Tiga Tantangan Utama MaaS — Masalah ketersediaan, variasi kinerja, dan ilusi pengurangan biaya.

  5. Lakukan yang Sulit tetapi Benar — Komitmen SiliconFlow untuk memberikan AI Infra yang lebih cepat, lebih baik, dan lebih hemat biaya.

  6. Empat Skenario AI 2025 — Pembuatan konten, AI Agenik (Tahun Agen), Pemrograman, dan aplikasi Multimodal.

  7. AI adalah Pekerjaan, Bukan Alat — Pergeseran paradigma Jensen Huang menekankan pembangunan untuk Agen daripada manusia.

  8. AI Infra — Tidak Ada Gelembung — Realitas pasar menunjukkan permintaan besar yang belum terpenuhi membuktikan tidak ada gelembung, hanya kekurangan pasokan.

Inference first

SiliconFlow memprediksi bahwa “di masa depan, sebagian besar kekuatan komputasi akan digunakan untuk inference, bukan pelatihan” pada tahun 2023. Tren ini menjadi kenyataan pada 2025, terutama didorong oleh dua faktor: pertumbuhan eksponensial dalam jumlah dan penggunaan pelanggan AI, serta pertumbuhan eksponensial dalam jumlah komputasi yang dibutuhkan untuk menyelesaikan satu tugas.

Peluang model open-source

Model open-source dengan cepat mengejar ketertinggalan dengan model closed-source dalam selang waktu dinamis 3–5 bulan. Saat ini, ekosistem open-source untuk LLM sudah mendekati state-of-the-art (SOTA), sementara untuk model multimodal seperti image, audio dan video, masih ada peluang signifikan untuk terobosan.

Panggilan untuk Model sebagai Layanan (MaaS)

Tahun ini, kami menyaksikan pembaruan model yang sering, spesifikasi beragam, arsitektur bervariasi, dan beberapa modalitas, tidak ada perusahaan yang dapat secara mandiri mendeploy dan memelihara semua model. Oleh karena itu, platform MaaS all-in-one yang dapat mengintegrasikan berbagai model telah menjadi titik masuk yang tak terhindarkan bagi pengembang. Inilah arah yang terus difokuskan oleh SiliconFlow, memungkinkan pengguna untuk dengan cepat merasakan berbagai model hanya dengan satu API.

Platform MaaS saat ini menghadapi tiga tantangan utama

  • Tantangan ketersediaan dan keandalan: Masalah seperti sumber daya yang tidak mencukupi dan kesalahan 429/503 telah terjadi.

  • Kinerja dan kualitas sangat bervariasi: model open-source yang sama disediakan oleh penyedia layanan berbeda menunjukkan perbedaan signifikan dalam kinerja aktual, mencerminkan tingkat kuantisasi dan optimasi model yang berbeda, yang secara langsung mempengaruhi kemampuan akhir model.

  • Ilusi penurunan biaya: Meskipun biaya satu model dapat menurun sepuluh kali lipat setiap tahun, pengguna selalu mencari model state-of-the-art (SOTA) terbaru dan terkuat, sementara harga penggunaan model kelas atas ini tetap relatif stabil. Sementara itu, jumlah tokens yang dikonsumsi untuk menyelesaikan satu tugas meningkat secara eksponensial, mengakibatkan tidak ada penurunan signifikan dalam biaya aplikasi aktual.

Lakukan yang sulit tetapi benar

SiliconFlow selalu berakar dalam di bidang AI Infra, memahami dengan mendalam tantangan yang terlibat, dan terus berdedikasi untuk mempromosikan implementasi solusi untuk memberikan layanan AI Infra yang lebih cepat, berkinerja lebih baik, dan lebih hemat biaya kepada pengguna.

Empat skenario AI yang banyak disepakati pada tahun 2025

  • Generasi konten: menghasilkan artikel, memberikan layanan pelanggan melalui chatbot, atau membangun basis pengetahuan, semua berpusat pada bahasa.

  • AI Agenik: Tahun ini disebut sebagai tahun Agen. Meskipun terdapat berbagai pemahaman tentang konsep Agen, ada beberapa perubahan. Misalnya, Manus telah berusaha keras untuk mempromosikan cara mendefinisikan Agen.

  • Pemrograman: Hal pertama yang dilakukan model arus utama yang dirilis tahun ini adalah menyesuaikan dengan kemampuan Agen dan Pemrograman. Industri umumnya setuju bahwa Agen dan Pemrograman adalah area yang paling banyak mengonsumsi tokens.

  • Multimodal: Terutama di lingkungan Internet Tiongkok, konsumsi model multimodal jauh lebih besar daripada bentuk lainnya.

“AI adalah Pekerjaan, Bukan Alat”

Jensen Huang mengusulkan bahwa “AI adalah Pekerjaan, Bukan Alat”, yang pada dasarnya adalah pergeseran paradigma. AI akan secara proaktif mengoperasikan alat untuk menyelesaikan tugas, daripada secara pasif merespon instruksi. Ini akan memicu pergeseran paradigma: membangun untuk agen, bukan untuk manusia. Manusia akan semakin mendelegasikan tugas kepada agen, beroperasi lebih sedikit secara langsung pada antarmuka perangkat lunak.

AI Infra — Tidak Ada Gelembung

Seluruh industri infrastruktur AI bebas dari gelembung, dan sebenarnya dalam keadaan “jauh dari kekurangan” pasokan. Perusahaan teknologi besar global telah merencanakan untuk membeli infrastruktur senilai ratusan miliar dolar yang belum terkirim. Bottleneck saat ini di industri adalah ketidakmampuan memproduksi chip dan kekurangan energi. Permintaan jauh melebihi kapasitas pasokan, membuktikan keaslian dan potensi pasar yang sangat besar.

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow