モデル比較

Meta-Llama-3.1-8B-Instruct

Qwen2.5-72B-Instruct

2026/02/28

価格

Input

$

0.06

/ M Tokens

$

0.59

/ M Tokens

Output

$

0.06

/ M Tokens

$

0.59

/ M Tokens

メタデータ

作成する

2024/09/16

ライセンス

LLAMA 3.1 COMMUNITY

-

プロバイダー

Meta Llama

Qwen

仕様

Deprecated

Available

建築

Transformer Decoder

Causal Transformer

キャリブレートされた

はい

いいえ

専門家の混合

いいえ

はい

合計パラメータ

8B

72B

アクティブ化されたパラメータ

8B

72.7B

推論

いいえ

いいえ

Precision

FP8

FP8

コンテキスト長

33K

33K

Max Tokens

4K

4K

対応機能

Serverless

対応

対応

Serverless LoRA

サポートされていません

サポートされていません

Fine-tuning

サポートされていません

サポートされていません

Embeddings

サポートされていません

サポートされていません

Rerankers

サポートされていません

サポートされていません

Image入力をサポートする

サポートされていません

サポートされていません

JSON Mode

対応

対応

構造化されたOutputs

サポートされていません

サポートされていません

ツール

サポートされていません

対応

Fim Completion

サポートされていません

サポートされていません

Chat Prefix Completion

対応

対応

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?