モデル比較

Qwen2.5-72B-Instruct

step3

2026/02/28

価格

Input

$

0.59

/ M Tokens

$

0.57

/ M Tokens

Output

$

0.59

/ M Tokens

$

1.42

/ M Tokens

メタデータ

作成する

2024/09/16

2025/07/28

ライセンス

-

APACHE LICENSE (VERSION 2.0)

プロバイダー

Qwen

StepFun

ハギングフェイス

仕様

Available

Deprecated

建築

transformers with RoPE, SwiGLU, RMSNorm, and Attention QKV bias

Mixture-of-Experts (MoE) architecture with Multi-Matrix Factorization Attention (MFA) and Attention-FFN Disaggregation (AFD)

キャリブレートされた

いいえ

いいえ

専門家の混合

はい

はい

合計パラメータ

72B

321B

アクティブ化されたパラメータ

38B

推論

いいえ

いいえ

Precision

FP8

FP8

コンテキスト長

33K

66K

Max Tokens

4K

66K

対応機能

Serverless

対応

対応

Serverless LoRA

サポートされていません

サポートされていません

Fine-tuning

サポートされていません

サポートされていません

Embeddings

サポートされていません

サポートされていません

Rerankers

サポートされていません

サポートされていません

Image入力をサポートする

サポートされていません

サポートされていません

JSON Mode

対応

対応

構造化されたOutputs

サポートされていません

サポートされていません

ツール

対応

対応

Fim Completion

サポートされていません

サポートされていません

Chat Prefix Completion

対応

サポートされていません

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow