模型

产品

定价

文档

博客

关于

联系

🎉 gemma-4-12B-it 可以在 SiliconFlow 上使用。现在就尝试吧。

🎉 gemma-4-12B-it 可以在 SiliconFlow 上使用。现在就尝试吧。

模型

Qwen3-30B-A3B-Thinking-2507

Qwen3-30B-A3B-Thinking-2507

API 参考

关于Qwen3-30B-A3B-Thinking-2507

Qwen3-30B-A3B-Thinking-2507 是 Qwen3 系列中最新的思考模型，由阿里巴巴的 Qwen 团队发布。作为一个 Mixture-of-Experts (MoE) 模型，拥有总计305亿个参数和33亿个活跃参数，它专注于增强复杂任务的能力。该模型在推理任务上展示了显著提高的性能，包括逻辑推理、数学、科学、编码和通常需要人类专长的学术基准测试。它还表现出显著更好的一般能力，例如遵循指令、工具使用、Text 生成和对人类偏好的对齐。该模型原生支持256K长上下文理解能力，并且可以扩展到100万个tokens。该版本专为‘思考模式’而设计，以通过逐步推理解决高度复杂的问题，并在代理能力方面也表现出色。

用例

探索Qwen3-30B-A3B-Thinking-2507的无与伦比的推理能力和超长上下文能力如何通过逐步的思维过程解决最具挑战性的现实世界问题。

高级科学发现

通过利用Qwen3的深度推理能力来分析复杂的科学数据，加速研究过程，得出新的假设，并以逐步的精度验证复杂的数学模型。

用例示例：

"一个材料科学团队使用Qwen3分析了TB级的模拟数据，通过推理量子力学原理，识别出合金中一个先前未知的相变，从而设计出了一种新材料。"

企业代码库优化

分析庞大的代码库（高达100万个token）以识别架构缺陷，提出重构策略，并通过推理复杂的系统交互和执行流程来优化性能。

用例示例：

"分析了一个遗留的Java微服务架构，定位了50多个服务中的循环依赖问题，提出了一个模块化的重构计划，提高了系统的稳定性，并将延迟减少了15%。"

复杂的法律和合规审查

自动审查大量法律文件、合同和监管框架。通过推理复杂条款和交叉引用庞大的法律数据库，识别不一致、潜在责任，并确保合规性。

用例示例：

"处理了一份500页的并购协议和所有相关的监管文件，标记出与国际数据隐私法相冲突的7个关键条款，防止了潜在的法律争端。"

智能AI代理编排

为复杂的AI代理提供高级计划和推理能力。编排多步任务，选择合适的工具，并动态调整策略，以在动态环境中实现复杂目标。

用例示例：

"开发了一种自主的金融代理，使用Qwen3规划多阶段投资策略，动态调用市场数据API、新闻聚合器和交易平台，根据实时分析执行交易。"

元数据

创建

2025年7月31日

许可证

APACHE-2.0

提供者

Qwen

HuggingFace

Qwen3-30B-A3B-Thinking-2507

规格

州

Deprecated

建筑

Mixture of Experts

校准的

不

专家混合

是

总参数

30B

激活的参数

3.3B

推理

不

精度

FP8

上下文长度

262K

最大输出长度

131K

与其他模型进行比较

看看这个模型与其他模型相比表现如何。

Qwen

chat

Qwen3-VL-32B-Instruct

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

发行日期：2025年10月15日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

发行日期：2025年10月15日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

发行日期：2025年10月4日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

发行日期：2025年10月4日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

发行日期：2025年10月5日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

发行日期：2025年10月11日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

发行日期：2025年8月13日

$

0.29

/ Video

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·