模型比较

DeepSeek-R1-Distill-Qwen-32B

对比

Qwen3-Coder-30B-A3B-Instruct

2026年2月10日

定价

Input

$

0.18

/ M Tokens

$

0.07

/ M Tokens

Output

$

0.18

/ M Tokens

$

0.28

/ M Tokens

元数据

创建

2025年1月20日

2025年7月31日

许可证

MIT LICENSE

APACHE-2.0

提供者

DeepSeek

Qwen

规格

Available

Available

建筑

Dense Transformer

Mixture of Experts

校准的

专家混合

总参数

32B

30B

激活的参数

32B

3.3B

推理

精度

FP8

FP8

上下文长度

131K

262K

最大输出长度

131K

262K

支持功能

Serverless

支持

支持

Serverless LoRA

不支持

不支持

微调

不支持

不支持

Embeddings

不支持

不支持

Rerankers

不支持

不支持

支持 Image Input

不支持

不支持

JSON Mode

支持

支持

结构化Outputs

不支持

不支持

工具

支持

支持

FIM 补全

支持

不支持

对话前缀补全

不支持

支持

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?