模型

产品

定价

文档

博客

关于

联系

🎉 gemma-4-31B-it 可以在 SiliconFlow 上使用。现在就尝试吧。

🎉 gemma-4-31B-it 可以在 SiliconFlow 上使用。现在就尝试吧。

模型

step3

step3

API 参考

关于step3

Step3是一种尖端的Multimodal推理模型，来自StepFun。它基于一种专家混合（MoE）架构，拥有321B总参数和38B活跃参数。该模型设计为端到端，以最小化解码成本，同时在vision-language推理中提供顶级性能。通过Multi-Matrix因子化注意力（MFA）和注意力-FFN离析（AFD）的共同设计，Step3在旗舰和低端加速器中都保持了卓越的效率。在预训练中，Step3处理了超过20T的Text tokens和4T的Image-Text混合tokens，涵盖了超过十种语言。该模型在各种基准测试上的开放源码模型中实现了最先进的性能，包括数学、代码和Multimodality。

用例

探索Step3的先进Multimodal推理如何高效解决复杂的现实问题。

Multimodal科学发现

通过分析复杂数据集、解释视觉数据(图表、Image)、生成证据和以井然有序、逐步的推理草拟论文来加速研究。

用例示例：

"通过解释电子显微镜Image并将其与光谱数据相关联，帮助材料科学家识别新的材料特性，显著加快实验验证。"

高级代码分析和调试

分析整个代码库，识别微妙的逻辑错误，并根据对算法和系统行为的深入理解提出性能优化建议，即使来自视觉日志。

用例示例：

"通过推理分布式日志和架构图，定位Rust高并发微服务中的竞态条件，提供了精确的修复，改善了系统稳定性。"

智能财务洞察

对财务报告、市场数据和视觉趋势进行多步骤定量分析，推断因果关系并生成详细的战略建议。

用例示例：

"通过分析公司的季度盈利报告、来自新闻文章的市场情绪和股票图表模式，生成了一份多页的投资论述，概述了风险和增长机会。"

Multimodal系统和合规审核

通过对逻辑依赖性进行推理，从多样化的数据类型中识别不一致性并标记潜在问题，利用AI审核复杂系统、法律合同或工程图纸。

用例示例：

"通过逻辑推理审查工业控制系统(ICS)图纸和操作日志，识别潜在的安全漏洞并建议更强大的配置。"

视觉内容解释

通过将视觉理解与文本上下文结合来自动摘要和数据提取，从Image、Video和复杂图表中提取深刻的见解。

用例示例：

"通过解释嵌入的图表、图表和显微镜Image自动总结医学研究论文的主要发现，生成简明的Text解释。"

互动学习和辅导

通过跨越视觉和文本信息的推理，为复杂问题生成逐步解决方案，解释图表，并创建互动教育内容。

用例示例：

"通过分析学生手绘图，识别错误并提供详细的、视觉辅助的解决路径，为几何问题开发了交互式教程。"

元数据

创建

2025年8月6日

许可证

APACHE LICENSE (VERSION 2.0)

提供者

StepFun

HuggingFace

规格

州

Deprecated

建筑

Mixture of Experts

校准的

不

专家混合

是

总参数

321B

激活的参数

38B

推理

不

精度

FP8

上下文长度

66K

最大输出长度

66K

与其他模型进行比较

看看这个模型与其他模型相比表现如何。

StepFun

chat

Step-3.5-Flash

发行日期：2026年2月11日

上下文长度：

262K

最大输出长度：

66K

Input:

$

0.1

/ M Tokens

Output:

$

0.3

/ M Tokens

StepFun

chat

step3

发行日期：2025年8月6日

上下文长度：

66K

最大输出长度：

66K

Input:

$

0.57

/ M Tokens

Output:

$

1.42

/ M Tokens

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·