モデル

製品

価格

ドキュメント

ブログ

約

連絡

🎉 gemma-4-12B-itはSiliconFlowで利用可能です。今すぐお試しください。

モデル

Qwen3-VL-8B-Instruct

Qwen3-VL-8B-Instruct

Qwen/Qwen3-VL-8B-Instruct

APIリファレンス

約Qwen3-VL-8B-Instruct

Qwen3-VL-8B-InstructはQwen3シリーズのVision-Imageモデルであり、一般的な視覚理解、視覚中心の対話、画像における多言語Text認識において強力な能力を示しています。

利用可能な Serverless

クエリをすぐに実行し、使用量のみを支払います

100万トークン（Input/Output）ごとに

0.18

/ M Tokens

100万トークン（Input/Output）ごとに

0.68

/ M Tokens

Playground

APIの使用

ベンチマーク

ユースケース

メタデータ

作成する

2025/10/15

ライセンス

APACHE-2.0

プロバイダー

Qwen

ハギングフェイス

Qwen3-VL-8B-Instruct

仕様

州

Available

建築

Vision-Language Transformer

キャリブレートされた

いいえ

専門家の混合

いいえ

合計パラメータ

アクティブ化されたパラメータ

推論

いいえ

Precision

FP8

コンテキスト長

262K

Max Tokens

262K

対応機能

Serverless

対応

Serverless LoRA

サポートされていません

Fine-tuning

サポートされていません

Embeddings

サポートされていません

Rerankers

サポートされていません

Image入力をサポートする

対応

JSON Mode

対応

構造化されたOutputs

サポートされていません

ツール

対応

Fim Completion

サポートされていません

Chat Prefix Completion

対応

他のModelsと比較

他のモデルに対してこのModelがどのように比較されるかを見てください。

Qwen

chat

Qwen3-VL-32B-Instruct

リリース日：2025/10/21

Total Context:

262K

Max output:

262K

Input：

0.2

/ M Tokens

Output:

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

リリース日：2025/10/21

Total Context:

262K

Max output:

262K

Input：

0.2

/ M Tokens

Output:

1.5

/ M Tokens

Qwen

chat