模型比較

Qwen2.5-72B-Instruct

對比

step3

2026年2月28日

定價

輸入

$

0.59

/ M Tokens

$

0.57

/ M Tokens

輸出

$

0.59

/ M Tokens

$

1.42

/ M Tokens

元數據

創建於

2024年9月16日

2025年7月28日

許可證

-

APACHE LICENSE (VERSION 2.0)

供應商

Qwen

StepFun

規格

Available

Deprecated

架構

transformers with RoPE, SwiGLU, RMSNorm, and Attention QKV bias

Mixture-of-Experts (MoE) architecture with Multi-Matrix Factorization Attention (MFA) and Attention-FFN Disaggregation (AFD)

經過校準的

專家混合

總參數

72B

321B

啟用的參數

38B

推理

精確

FP8

FP8

上下文長度

33K

66K

最大輸出長度

4K

66K

支援的功能

無伺服器

支持

支持

無伺服器的 LoRA

不支持

不支持

微調

不支持

不支持

嵌入

不支持

不支持

重新排名者

不支持

不支持

支援圖片輸入

不支持

不支持

JSON 模式

支持

支持

結構化輸出

不支持

不支持

工具

支持

支持

完成最後一步

不支持

不支持

聊天前綴完成

支持

不支持

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

準備好 加速您的人工智能開發了嗎?

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow

Chinese (Traditional Han, Taiwan)

© 2025 SiliconFlow