約Qwen2.5-Coder-32B-Instruct
Qwen2.5-Coder-32B-Instructは、Qwen2.5をベースに開発されたコード特化の大規模言語モデルです。このModelは、5.5兆のtokenを使ってトレーニングを受けており、コード生成、コード推論、そしてコード修正において大きな改善を遂げています。現在、オープンソースのコード言語モデルとして最先端であり、そのコーディング能力はGPT-4に匹敵します。このModelは、コーディング能力を向上させただけでなく、数学や一般的な能力においても強みを持ち、長Text処理もサポートしています。
利用可能な Serverless
クエリをすぐに実行し、使用量のみを支払います
$
0.18
/
$
0.18
100万トークン(Input/Output)ごとに
メタデータ
仕様
州
Available
建築
transformers with RoPE, SwiGLU, RMSNorm, and Attention QKV bias
キャリブレートされた
いいえ
専門家の混合
いいえ
合計パラメータ
32B
アクティブ化されたパラメータ
32.5B
推論
いいえ
Precision
FP8
コンテキスト長
33K
Max Tokens
4K
対応機能
Serverless
対応
Serverless LoRA
サポートされていません
Fine-tuning
サポートされていません
Embeddings
サポートされていません
Rerankers
サポートされていません
Image入力をサポートする
サポートされていません
JSON Mode
対応
構造化されたOutputs
サポートされていません
ツール
サポートされていません
Fim Completion
対応
Chat Prefix Completion
対応
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。

Qwen
chat
Qwen3-VL-32B-Instruct
リリース日:2025/10/21
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
リリース日:2025/10/21
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
リリース日:2025/10/15
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
リリース日:2025/10/15
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
リリース日:2025/10/04
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
リリース日:2025/10/04
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
リリース日:2025/10/05
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
リリース日:2025/10/11
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
リリース日:2025/08/13
$
0.29
/ Video
