Step-3.5-Flash
Tentang Step-3.5-Flash
Step 3.5 Flash is StepFun's most capable open-source foundation model, built on a sparse Mixture of Experts (MoE) architecture with 196B total parameters and only 11B activated per token. It supports a 262K context window and achieves 100-300 tok/s generation throughput via 3-way Multi-Token Prediction (MTP-3). The model excels at coding and agentic tasks, achieving 74.4% on SWE-bench Verified and 51.0% on Terminal-Bench 2.0
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.1
/
$
0.3
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Sparse Mixture-of-Experts (MoE) transformer architecture
Terkalibrasi
Tidak
Campuran Ahli
Ya
Total Parameter
196B
Parameter yang Diaktifkan
11B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
262K
Max Tokens
66K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
Tidak didukung
Output Terstruktur
Tidak didukung
Alat
didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

