關於Qwen3-VL-235B-A22B-Instruct
Qwen3-VL-235B-A22B-Instruct 是基於 235B 參數的專家混合 (MoE) 視覺-語言模型,具有 22B 啟動參數。這是一個經過指令調整的 Qwen3-VL-235B-A22B 版本,適用於聊天應用程式。
探索 Qwen3-VL-235B-A22B-Instruct 的先進視覺語言能力和多模態推理如何解決複雜的實際問題。
AI UI 自動化
通過視覺理解界面和執行操作,來自動化網頁和移動應用程序中的複雜 UI 任務。
使用案例範例:
"自動導航新的電子商務網站,將商品加入購物車,並通過解讀視覺提示與 UI 元素交互來完成結帳,而不需要明確的 API 調用。"
視覺代碼生成
將視覺設計(草圖、模型或視頻演示)直接轉化為功能性網頁組件或圖表。
使用案例範例:
"將手繪的網頁線框轉化為響應式 HTML/CSS/JS 代碼,包括互動元素,顯著加速前端開發工作流。"
高級視頻分析
分析長時間視頻資料中的特定事件、物體或動作,生成詳細的摘要和見解,提供秒級索引。
使用案例範例:
"處理 8 小時的監控攝像頭視頻,識別所有未經授權的訪問,跟蹤特定個體,並生成帶有視覺證據的時間戳報告。"
多模態文檔 AI
從複雜、視覺豐富的文檔(包括掃描圖像、報告和工程圖紙)中提取、分析和推理信息。
使用案例範例:
"解析多頁工程藍圖,提取組件清單,識別部件之間的空間關係,並根據視覺和文本數據標示潛在的設計不一致。"
機器人的空間推理
讓 AI 系統通過準確感知物體的位置、方向和空間關係來理解和與物理環境互動。
使用案例範例:
"指導機器手臂精確拾取和放置雜亂箱中的不規則形狀物體,並在實時中適應不同的視點和部分遮擋。"
元數據
規格
狀態
Deprecated
架構
Mixture of Experts
經過校準的
是
專家並行
是
總參數
235B
啟用的參數
22B
推理
否
精度
FP8
上下文長度
262K
最大輸出長度
262K
與其他模型比較
看看這個模型與其他模型的對比如何。

Qwen
chat
Qwen3.6-35B-A3B
發行日期:2026年5月9日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
1.6
/ M Tokens

Qwen
chat
Qwen3.6-27B
發行日期:2026年5月9日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.3
/ M Tokens
輸出:
$
3.2
/ M Tokens

Qwen
chat
Qwen3.5-397B-A17B
發行日期:2026年5月9日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.39
/ M Tokens
輸出:
$
2.34
/ M Tokens

Qwen
chat
Qwen3.5-122B-A10B
發行日期:2026年5月9日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.26
/ M Tokens
輸出:
$
2.08
/ M Tokens

Qwen
chat
Qwen3.5-35B-A3B
發行日期:2026年5月9日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.24
/ M Tokens
輸出:
$
1.8
/ M Tokens

Qwen
chat
Qwen3.5-27B
發行日期:2026年5月9日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.25
/ M Tokens
輸出:
$
2.0
/ M Tokens

Qwen
chat
Qwen3.5-9B
發行日期:2026年5月9日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.1
/ M Tokens
輸出:
$
0.15
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Instruct
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
1.5
/ M Tokens
