step3
Tentang step3
Step3 adalah model penalaran Multimodal mutakhir dari StepFun. Itu dibangun pada arsitektur Mixture-of-Experts (MoE) dengan total 321B parameter dan 38B parameter aktif. Model ini dirancang end-to-end untuk meminimalkan biaya decoding sambil memberikan performa kelas atas dalam penalaran vision-language. Melalui desain bersama Multi-Matrix Factorization Attention (MFA) dan Attention-FFN Disaggregation (AFD), Step3 mempertahankan efisiensi yang sangat baik di kedua akselerator unggulan dan kelas bawah. Selama prapelatihan, Step3 memproses lebih dari 20T text tokens dan 4T image-text mixed tokens, melintasi lebih dari sepuluh bahasa. Model ini telah mencapai performa state-of-the-art untuk model open-source di berbagai tolok ukur, termasuk matematika, kode, dan multimodalitas.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.57
/
$
1.42
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Tidak
Campuran Ahli
Ya
Total Parameter
321B
Parameter yang Diaktifkan
38B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
66K
Max Tokens
66K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
didukung
JSON Mode
didukung
Output Terstruktur
Tidak didukung
Alat
didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
Tidak didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

