約Step-3.5-Flash
Step 3.5 Flash is StepFun's most capable open-source foundation model, built on a sparse Mixture of Experts (MoE) architecture with 196B total parameters and only 11B activated per token. It supports a 262K context window and achieves 100-300 tok/s generation throughput via 3-way Multi-Token Prediction (MTP-3). The model excels at coding and agentic tasks, achieving 74.4% on SWE-bench Verified and 51.0% on Terminal-Bench 2.0
利用可能な Serverless
クエリをすぐに実行し、使用量のみを支払います
$
0.1
/
$
0.3
100万トークン(Input/Output)ごとに
メタデータ
仕様
州
Available
建築
Sparse Mixture-of-Experts (MoE) transformer architecture
キャリブレートされた
いいえ
専門家の混合
はい
合計パラメータ
196B
アクティブ化されたパラメータ
11B
推論
いいえ
Precision
FP8
コンテキスト長
262K
Max Tokens
66K
対応機能
Serverless
対応
Serverless LoRA
サポートされていません
Fine-tuning
サポートされていません
Embeddings
サポートされていません
Rerankers
サポートされていません
Image入力をサポートする
サポートされていません
JSON Mode
サポートされていません
構造化されたOutputs
サポートされていません
ツール
対応
Fim Completion
サポートされていません
Chat Prefix Completion
対応

