約Qwen3-VL-235B-A22B-Instruct
Qwen3-VL-235B-A22B-Instructは235Bパラメータを持つ専門家の集合(MoE)Vision-language Modelで、22Bのアクティブパラメータがあります。これはQwen3-VL-235B-A22Bの指示調整されたバージョンで、Chatアプリケーションに合わせられています。
Qwen3-VL-235B-A22B-Instructの高度なVision-言語機能とMultimodal推論が、複雑な現実世界の問題をどのように解決できるかを探ります。
AI UIオートメーション
視覚的にインターフェースを理解し、アクションを実行することで、ウェブおよびモバイルアプリケーション全体の複雑なUIタスクを自動化します。
ユースケースの例:
"新しいeコマースサイトを自動的にナビゲートし、アイテムをカートに追加し、APIコールなしでUI要素とインタラクションしてチェックアウトを完了します。"
ビジュアルコード生成
視覚デザイン(スケッチ、モックアップ、またはビデオデモ)を直接機能するウェブコンポーネントや図に変換します。
ユースケースの例:
"手描きのウェブページワイヤーフレームを、インタラクティブな要素を含むレスポンシブなHTML/CSS/JSコードに変換し、フロントエンド開発ワークフローを大幅に加速します。"
高度なVideo分析
特定のイベント、物体、またはアクションを対象に長時間のVideo映像を分析し、詳細な要約と洞察を生成し、秒単位のインデックスを作成します。
ユースケースの例:
"8時間のセキュリティカメラフィードを処理し、不正アクセスのすべての例を特定し、特定の個人の追跡、視覚証拠を含むタイムスタンプ付きレポートを生成します。"
MultimodalドキュメントAI
スキャンイメージ、レポート、エンジニアリング図面を含む複雑で視覚的に豊かなドキュメントから情報を抽出、分析、理由付けします。
ユースケースの例:
"複数ページのエンジニアリング図面を解析し、コンポーネントリストを抽出し、部品間の空間関係を特定し、視覚およびテキストデータに基づいて設計の矛盾をフラグ付けします。"
ロボティックスペーシャル推論
AIシステムが物理環境を正確に理解し、物体の位置、配向、および空間的関係を認識することでインタラクションを可能にします。
ユースケースの例:
"ロボットアームを誘導して、乱雑なビンから不規則な形状の物体を正確にピックアンドプレースし、リアルタイムで様々な視点と一部の遮蔽物に適応します。"
メタデータ
仕様
州
Deprecated
建築
Mixture of Experts
キャリブレートされた
はい
専門家の混合
はい
合計パラメータ
235B
アクティブ化されたパラメータ
22B
推論
いいえ
Precision
FP8
コンテキスト長
262K
Max Tokens
262K
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。

Qwen
chat
Qwen3-VL-32B-Instruct
リリース日:2025/10/21
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
リリース日:2025/10/21
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
リリース日:2025/10/15
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
リリース日:2025/10/15
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
リリース日:2025/10/04
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
リリース日:2025/10/04
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
リリース日:2025/10/05
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
リリース日:2025/10/11
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
リリース日:2025/08/13
$
0.29
/ Video
