關於Step-3.5-Flash
Step 3.5 Flash is StepFun's most capable open-source foundation model, built on a sparse Mixture of Experts (MoE) architecture with 196B total parameters and only 11B activated per token. It supports a 262K context window and achieves 100-300 tok/s generation throughput via 3-way Multi-Token Prediction (MTP-3). The model excels at coding and agentic tasks, achieving 74.4% on SWE-bench Verified and 51.0% on Terminal-Bench 2.0
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.1
/
$
0.3
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
Available
架構
Sparse Mixture-of-Experts (MoE) transformer architecture
經過校準的
否
專家並行
是
總參數
196B
啟用的參數
11B
推理
否
精度
FP8
上下文長度
262K
最大輸出長度
66K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
不支持
結構化輸出
不支持
工具
支持
中間填充補全
不支持
聊天前綴補全
支持

