Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507

Qwen/Qwen3-235B-A22B-Thinking-2507

关于Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507 是 Qwen3 大型语言模型系列的成员,由阿里巴巴的 Qwen 团队开发,专门从事高度复杂的推理任务。该模型基于专家混合(MoE)架构,具有 2350 亿个总参数,约 220 亿个激活参数每个 token,增强了计算效率,同时保持了强大的性能。作为一个专门的“思考”模型,它在需要人类专业知识的任务中表现出显著的性能改进,例如逻辑推理、数学、科学、编码和学术基准,获取了开源思考模型中最先进的成果。此外,该模型具有增强的通用能力,如指令跟随、工具使用和 Text 生成,并原生支持 256K 长上下文理解能力,使其在需要深度推理和处理长文档的场景中表现出色。

可用的 Serverless

立即运行查询,仅按使用量付费

$

0.13

/

$

0.6

每 100 万 token(Input/Output)

元数据

创建

2025年7月28日

许可证

APACHE-2.0

提供者

Qwen

规格

Available

建筑

校准的

专家混合

总参数

235B

激活的参数

22B

推理

精度

FP8

上下文长度

262K

最大输出长度

262K

支持功能

Serverless

支持

Serverless LoRA

不支持

微调

不支持

Embeddings

不支持

Rerankers

不支持

支持 Image Input

不支持

JSON Mode

支持

结构化Outputs

不支持

工具

支持

FIM 补全

不支持

对话前缀补全

支持

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?