step3

stepfun-ai/step3

Tentang step3

Step3 adalah model penalaran Multimodal mutakhir dari StepFun. Itu dibangun pada arsitektur Mixture-of-Experts (MoE) dengan total 321B parameter dan 38B parameter aktif. Model ini dirancang end-to-end untuk meminimalkan biaya decoding sambil memberikan performa kelas atas dalam penalaran vision-language. Melalui desain bersama Multi-Matrix Factorization Attention (MFA) dan Attention-FFN Disaggregation (AFD), Step3 mempertahankan efisiensi yang sangat baik di kedua akselerator unggulan dan kelas bawah. Selama prapelatihan, Step3 memproses lebih dari 20T text tokens dan 4T image-text mixed tokens, melintasi lebih dari sepuluh bahasa. Model ini telah mencapai performa state-of-the-art untuk model open-source di berbagai tolok ukur, termasuk matematika, kode, dan multimodalitas.

Tersedia Serverless

Jalankan kueri segera, bayar hanya untuk penggunaan

$

0.57

/

$

1.42

Per 1M Token (Input/Output)

Metadata

Buat di

6 Agu 2025

Lisensi

APACHE LICENSE (VERSION 2.0)

Penyedia

StepFun

HuggingFace

Spesifikasi

Negara

Available

Arsitektur

Terkalibrasi

Tidak

Campuran Ahli

Ya

Total Parameter

321B

Parameter yang Diaktifkan

38B

Penalaran

Tidak

Precision

FP8

Text panjang konteks

66K

Max Tokens

66K

Didukung Keberfungsian

Serverless

didukung

Serverless LoRA

Tidak didukung

Fine-tuning

Tidak didukung

Embeddings

Tidak didukung

Rerankers

Tidak didukung

Dukung Image Input

didukung

JSON Mode

didukung

Output Terstruktur

Tidak didukung

Alat

didukung

Fim Completion

Tidak didukung

Chat Prefix Completion

Tidak didukung

Bandingkan dengan Model Lain

Lihat bagaimana model ini dibandingkan dengan yang lain.

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow