關於Qwen3.5-9B
Qwen3.5-9B is a native multimodal large language model from the Qwen team with 9B parameters. As a lightweight dense model in the Qwen3.5 series, it features an efficient hybrid architecture combining Gated Delta Networks with Gated Attention, natively supporting a 262K context length extensible up to ~1M tokens. The model achieves unified vision-language capabilities through early fusion training, supporting text, image, and video understanding. It defaults to thinking mode, supports tool calling, and covers 201 languages and dialects
可用的無伺服器
立即運行查詢,僅按使用量付費
每百萬 Tokens(輸入/輸出)
$
0.1
/ M Tokens
每百萬 Tokens(輸入/輸出)
$
0.15
/ M Tokens
元數據
規格
狀態
Available
架構
Hybrid Gated Architecture
經過校準的
否
專家並行
否
總參數
9B
啟用的參數
9B
推理
否
精度
FP8
上下文長度
262K
最大輸出長度
262K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
支持
JSON 模式
支持
結構化輸出
不支持
工具
支持
中間填充補全
不支持
聊天前綴補全
不支持
與其他模型比較
看看這個模型與其他模型的對比如何。

Qwen
chat
Qwen3.6-35B-A3B
發行日期:2026年4月17日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
1.6
/ M Tokens

Qwen
chat
Qwen3.6-27B
發行日期:2026年4月23日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.3
/ M Tokens
輸出:
$
3.2
/ M Tokens

Qwen
chat
Qwen3.5-397B-A17B
發行日期:2026年4月24日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.39
/ M Tokens
輸出:
$
2.34
/ M Tokens

Qwen
chat
Qwen3.5-122B-A10B
發行日期:2026年4月24日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.26
/ M Tokens
輸出:
$
2.08
/ M Tokens

Qwen
chat
Qwen3.5-35B-A3B
發行日期:2026年2月25日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.24
/ M Tokens
輸出:
$
1.8
/ M Tokens

Qwen
chat
Qwen3.5-27B
發行日期:2026年4月24日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.25
/ M Tokens
輸出:
$
2.0
/ M Tokens

Qwen
chat
Qwen3.5-9B
發行日期:2026年4月24日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.1
/ M Tokens
輸出:
$
0.15
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Instruct
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
1.5
/ M Tokens
