🎉 gemma-4-31B-it 可以在 SiliconFlow 上使用。现在就尝试吧。
开始
一个API可以对200多个尖端AI模型进行推理,并在几秒钟内部署
All
Featured
LLM
Vision
Image
Video
Audio
Serverless
StepFun
Text Generation
发行日期:2026年2月11日
步骤 3.5 Flash 是 StepFun 最强大的开源基础模型,基于稀疏专家混合(MoE)架构构建,总参数为 1960 亿,仅每个 token 激活 110 亿。它支持 262K 的上下文窗口,通过三路多 token 预测 (MTP-3) 实现 100-300 tok/s 的生成吞吐量。该模型擅长编码和代理任务,在 SWE-bench Verified 上获得 74.4% 的成绩,在 Terminal-Bench 2.0 上获得 51.0%的成绩。...
上下文长度:
262K
最大输出长度:
66K
Input:
$
0.1
/ M Tokens
text
Output:
0.3
准备好 加速您的人工智能开发吗?
免费开始使用
页面
首页
模型
产品
文档
定价
博客
关于
联系
模型S
概览
推理
微调
预留 GPU
订阅以获取更新
订阅
© 2025 SiliconFlow
条款
·
隐私