模型

產品

定價

文檔

部落格

關於

聯繫

🎉 Kimi-K3可在 SiliconFlow 上使用。現在就試試看。

模型

Qwen3-VL-235B-A22B-Instruct

Qwen3-VL-235B-A22B-Instruct

API 參考

關於Qwen3-VL-235B-A22B-Instruct

Qwen3-VL-235B-A22B-Instruct 是基於 235B 參數的專家混合 (MoE) 視覺-語言模型，具有 22B 啟動參數。這是一個經過指令調整的 Qwen3-VL-235B-A22B 版本，適用於聊天應用程式。

用例

探索 Qwen3-VL-235B-A22B-Instruct 的先進視覺語言能力和多模態推理如何解決複雜的實際問題。

AI UI 自動化

通過視覺理解界面和執行操作，來自動化網頁和移動應用程序中的複雜 UI 任務。

使用案例範例：

"自動導航新的電子商務網站，將商品加入購物車，並通過解讀視覺提示與 UI 元素交互來完成結帳，而不需要明確的 API 調用。"

視覺代碼生成

將視覺設計（草圖、模型或視頻演示）直接轉化為功能性網頁組件或圖表。

使用案例範例：

"將手繪的網頁線框轉化為響應式 HTML/CSS/JS 代碼，包括互動元素，顯著加速前端開發工作流。"

高級視頻分析

分析長時間視頻資料中的特定事件、物體或動作，生成詳細的摘要和見解，提供秒級索引。

使用案例範例：

"處理 8 小時的監控攝像頭視頻，識別所有未經授權的訪問，跟蹤特定個體，並生成帶有視覺證據的時間戳報告。"

多模態文檔 AI

從複雜、視覺豐富的文檔（包括掃描圖像、報告和工程圖紙）中提取、分析和推理信息。

使用案例範例：

"解析多頁工程藍圖，提取組件清單，識別部件之間的空間關係，並根據視覺和文本數據標示潛在的設計不一致。"

機器人的空間推理

讓 AI 系統通過準確感知物體的位置、方向和空間關係來理解和與物理環境互動。

使用案例範例：

"指導機器手臂精確拾取和放置雜亂箱中的不規則形狀物體，並在實時中適應不同的視點和部分遮擋。"

元數據

創建於

2025年10月4日

許可證

APACHE-2.0

供應商

Qwen

HuggingFace

Qwen3-VL-235B-A22B-Instruct

規格

狀態

Deprecated

架構

Mixture of Experts

經過校準的

是

專家並行

是

總參數

235B

啟用的參數

22B

推理

否

精度

FP8

上下文長度

262K

最大輸出長度

262K

與其他模型比較

看看這個模型與其他模型的對比如何。

Qwen

chat

Qwen3-VL-32B-Instruct

發行日期：2025年10月21日

總上下文：

262K

最大輸出：

262K

輸入：

0.2

/ M Tokens

輸出：

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

發行日期：2025年10月21日

總上下文：

262K

最大輸出：

262K

輸入：

0.2

/ M Tokens

輸出：

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

發行日期：2025年10月15日

總上下文：

262K

最大輸出：

262K

輸入：

0.18

/ M Tokens

輸出：

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

發行日期：2025年10月15日

總上下文：

262K

最大輸出：

262K

輸入：

0.18

/ M Tokens

輸出：

2.0

/ M Tokens

Qwen

chat