关于Step-3.5-Flash
步骤 3.5 Flash 是 StepFun 最强大的开源基础模型,基于稀疏专家混合(MoE)架构构建,总参数为 1960 亿,仅每个 token 激活 110 亿。它支持 262K 的上下文窗口,通过三路多 token 预测 (MTP-3) 实现 100-300 tok/s 的生成吞吐量。该模型擅长编码和代理任务,在 SWE-bench Verified 上获得 74.4% 的成绩,在 Terminal-Bench 2.0 上获得 51.0%的成绩。
可用的 Serverless
立即运行查询,仅按使用量付费
$
0.1
/
$
0.3
每 100 万 token(Input/Output)
元数据
规格
州
Available
建筑
校准的
不
专家混合
是
总参数
196B
激活的参数
11B
推理
不
精度
FP8
上下文长度
262K
最大输出长度
66K
支持功能
Serverless
支持
Serverless LoRA
不支持
微调
不支持
Embeddings
不支持
Rerankers
不支持
支持 Image Input
不支持
JSON Mode
不支持
结构化Outputs
不支持
工具
支持
FIM 补全
不支持
对话前缀补全
支持

