Step3 Sekarang Tersedia di SiliconFlow: Pemimpin Sumber Terbuka Reasoning Multimodal Model

11 Agu 2025

Daftar Isi

Step3 Sekarang Tersedia di SiliconFlow: Pemimpin Sumber Terbuka Reasoning Multimodal Model
Step3 Sekarang Tersedia di SiliconFlow: Pemimpin Sumber Terbuka Reasoning Multimodal Model

Step3, model penalaran multimodal terbaru Stepfun yang canggih kini tersedia di SiliconFlow. Dibangun di atas arsitektur MoE berskala besar dengan total 321B parameter dan 38B parameter aktif, model ini menawarkan kinerja luar biasa dalam penalaran visi-bahasa. Ini menawarkan efisiensi decoding yang dioptimalkan untuk kebutuhan perusahaan dan pengembang, memungkinkan penalaran multimodal yang terarah dengan interpretasi visual yang akurat dan mengurangi halusinasi.

Dengan API Step3 dari SiliconFlow, Anda dapat mengharapkan:

  • Harga Yang Efektif Biaya: Step3 $0,57/M tokens (input) dan $1,42/M tokens (output).

  • Panjang Konteks: Mendukung panjang konteks 64K.

  • Dukungan Alat Asli / Panggilan Fungsi.

Kemampuan Utama & Kinerja Tolok Ukur

Step3 memiliki kemampuan persepsi visual yang kuat dan penalaran lanjutan, memungkinkan pemahaman lintas domain yang akurat, penalaran matematis multimodal, dan tugas pemahaman visual yang terarah di dunia nyata.

Kemampuan ini ditunjukkan melalui kinerja yang kuat di seluruh tolok ukur standar industri, menunjukkan efektivitasnya dalam tugas-tugas yang memerlukan pemahaman dan penalaran visual:

  • Kinerja Tolok Ukur VLM: Step3 mencapai skor MMMU tertinggi (74,2) di antara model VLM sumber terbuka, melampaui VLM kepemilikan seperti Gemini 2.5 Flash (73,2); 64,2 pada Hallusion Bench, melebihi model kepemilikan terkemuka termasuk Claude Opus 4 (59,9), Claude Sonnet 4 (57,0), dan o3 (60,1), menunjukkan kinerja superior Step3 dalam penalaran visual yang kompleks, faktualitas, dan pemahaman lintas domain.

  • Kinerja Tolok Ukur LLM: Step3 mempertahankan hasil kompetitif dengan 82,9 di AIME25, 73,0 di GPQA-Diamond, dan 67,1 di LiveCodeBench, menunjukkan kemampuan kuat dalam penalaran matematis, penalaran tingkat lulusan atas dan pembuatan kode.

Selain kinerja tingkat atasnya, Step3 juga hadir dengan biaya lebih rendah — menjadikannya pilihan yang hemat anggaran untuk beban kerja Anda.

Sorotan Teknis

Step3 menangani tantangan utama dalam kesejajaran multimodal, biaya decoding, dan efisiensi inferensi melalui optimisasi komprehensif di seluruh desain arsitektur model, pipeline pelatihan, dan implementasi:

  • Arsitektur Model Pralatihan: Step3 menggunakan mekanisme Perhatian Faktorisasi Multi-Matriks (MFA) baru yang mengurangi overhead cache KV dan biaya komputasi sambil mempertahankan kemampuan model dan efisiensi inferensi.

  • Kemampuan Multimodal:

    • Step3 menggunakan 5B Vision Encoder dengan penyampelan ulang dua lapisan 2D, mengurangi visual tokens menjadi 1/16 dari ukuran asli untuk efisiensi yang lebih baik;

    • Pelatihan mengadopsi pendekatan dua tahap: pertama meningkatkan persepsi encoder, lalu membekukan vision encoder untuk mengoptimalkan lapisan backbone dan penghubung.

  • Arsitektur Sistem AFD: Step3 menerapkan Disaggregasi Perhatian-FFN (AFD) yang memisahkan tugas komputasi ke dalam subsistem khusus dengan penjadwalan pipeline multi-tahap, secara efektif meningkatkan efisiensi throughput keseluruhan.

Kinerja Dunia Nyata di SiliconFlow

Unggah struk makan di Step3 di SiliconFlow untuk menghitung kalori makanan. Ini secara akurat mengidentifikasi item makanan, menguraikan deskripsi kompleks, mengkategorikan hidangan, mencocokkannya dengan nilai kalori dan memperkirakan total kalori (misalnya, 900-1330 kkal).

Proses ini membentuk satu putaran lengkap — dari data mentah hingga pengenalan konsep, perhitungan, dan penjelasan akhir — dengan logika yang jelas dan konsisten di setiap tahap.

Mulai Segera

  1. Eksplorasi: Cobalah Step3 di Playground SiliconFlow.

  2. Integrasi: Gunakan API kami yang kompatibel dengan OpenAI. Jelajahi spesifikasi lengkap API di dokumentasi API SiliconFlow.

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "stepfun-ai/step3",
    "max_tokens": 65536,
    "min_p": 0.05,
    "temperature": 0.7,
    "top_p": 0.7,
    "top_k": 50,
    "messages": [
        {
            "role": "user",
            "content": "tell me a story"
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

Buka Kekuatan AI Visual! Coba Step3 sekarang di SiliconFlow!

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow