Qwen3-VL-32B 現在在 SiliconFlow 上：旗艦級智慧與密集模型效能

2025年10月28日

總結：Qwen3-VL-32B——Qwen3-VL系列的最新成員——現在可以在SiliconFlow使用。僅用32B密集參數即可實現旗艦級多模態推理和理解，超越GPT-5 mini和Claude 4 Sonnet，同時提供更快的響應速度、更低的成本及高效率與性能的出色平衡。通過SiliconFlow的OpenAI**/Anthropic兼容API**開啟創建，並解鎖旗艦級智慧的密集性能。

在SiliconFlow上已經推出的Qwen3-VL-235B和Qwen3-VL-8B模型基礎上，Qwen3-VL-32B進一步豐富了Qwen3-VL家族，在輕量級到旗艦級模型的範疇內完成了全覆蓋多模態理解場景。儘管僅使用32B的參數，就能達到與235B規模模型相媲美的性能，並且在像OSWorld這樣的基準測試中，展現出卓越的效率和推理能力。

通過SiliconFlow的Qwen3-VL-32B API，您可以期待：

具有成本效益的定價：
- Qwen3-VL-32B-Instruct：$0.2/M tokens (輸入) 和 $0.6/M tokens (輸出)
- Qwen3-VL-32B-Thinking：$0.2/M tokens (輸入) 和 $1.5/M tokens (輸出)
兩個模型變體：
- Instruct：提供更快的響應和更穩定的執行，適合對話和工具調用任務。
- Thinking：增強長鏈推理和複雜的視覺理解，能夠通過挑戰性多模態問題進行「觀察和思考」。
262K上下文窗口：實現長文本和多輪對話的無縫處理。

無論您是在探索視覺推理、文檔分析，還是多模態代理開發，SiliconFlow的Qwen3-VL-32B API都能輕鬆將旗艦級多模態智慧應用於現實世界。

關鍵特性與基準性能

Qwen3-VL系列在任務中授權多模態智慧——從視覺理解、內容生成到推理和創意創建，讓看見和理解世界變得更輕、更快、更聰明。

在此基礎上，Qwen3-VL-32B系列在多模態和純文本基準中實現了新的高度，結合密集級效率和旗艦級性能：

多模態性能：Qwen3-VL-32B在STEM推理、VQA、OCR、視頻理解和代理任務中表現出色，持續超越GPT-5 mini和Claude 4 Sonnet在主要類別上的表現。
在OSWorld上排名第一：「看、推理和行動」的能力在復雜視覺務中、和中**代理任務中**中，顯示出他出色的多模態推理能力和推理能力。」
。
文本和推理性能：Qwen3-VL-32B還在純文本推理中表現出色，顯示了語言理解和邏輯推理的卓越性能。

截至今日，SiliconFlow提供完整的Qwen3-VL模型系列，包括：

密集模型：Qwen3-VL-8B和Qwen3-VL-32B
MoE模型：Qwen3-VL-30B-A3B和Qwen3-VL-235B-A22B

每個模型均提供Instruct和Thinking兩個變體，讓開發者靈活訪問對應的API服務並選擇性能、效率與推理深度的最佳平衡。

真實應用場景

為開發者和研究者構建，Qwen3-VL-32B在多模態AI應用中解鎖了新的可能性：

視頻理解與分析：識別動作、總結場景和跟踪長視頻中的時間動態，用於自動化或媒體智能。
視覺推理與STEM任務：解讀圖表、科學圖表和複雜的數學問題，進行上下文推理，理想用於教育、研究和技術文檔。

多模態代理：連接感知和推理，構建能夠理解圖像、分析數據且進行上下文操作的智能助手。
文檔與OCR理解：從掃描文檔、收據或手寫筆記中提取並總結關鍵信息，具有高精度。

立即開始使用

探索：在SiliconFlow操作台中嘗試Qwen3-VL-32B。
集成：使用我們的OpenAI兼容API。從SiliconFlow API文檔探索完整API規範。

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)