關於Qwen3-235B-A22B-Instruct-2507
Qwen3-235B-A22B-Instruct-2507是來自阿里巴巴雲的Qwen團隊開發的Qwen3系列中的旗艦專家混合(MoE)大型語言模型。該模型總共擁有2350億個參數,每次傳遞啟用了220億個參數。它作為Qwen3-235B-A22B無思維模式的更新版本發布,具有顯著增強的通用能力,如指令遵循、邏輯推理、文本理解、數學、科學、編碼和工具使用。此外,該模型在多種語言的長尾知識覆蓋方面提供了實質性提升,並在主觀和開放式任務中的用戶偏好對齊方面顯著改善,能夠提供更有用的回應和更高質量的文本生成。值得注意的是,它原生支持256K(262,144個標記)上下文窗口,大大增強了其長上下文理解的能力。此版本專門支持無思維模式,不生成<think>塊,旨在為直接問答和知識檢索這類任務提供更高效和精確的回應。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.09
/
$
0.6
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
可用
架構
經過校準的
是
專家並行
是
總參數
235B
啟用的參數
22B
推理
不
精度
FP8
上下文長度
262K
最大輸出長度
262K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
支持
結構化輸出
不支持
工具
支持
中間填充補全
不支持
聊天前綴補全
支持
與其他模型比較
看看這個模型與其他模型的對比如何。

Qwen
聊天
Qwen3-VL-32B-Instruct
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
0.6
/ M Tokens

Qwen
聊天
Qwen3-VL-32B-Thinking
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
1.5
/ M Tokens

Qwen
聊天
Qwen3-VL-8B-Instruct
發行日期:2025年10月15日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.18
/ M Tokens
輸出:
$
0.68
/ M Tokens

Qwen
聊天
Qwen3-VL-8B-Thinking
發行日期:2025年10月15日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.18
/ M Tokens
輸出:
$
2.0
/ M Tokens

Qwen
聊天
Qwen3-VL-235B-A22B-Instruct
發行日期:2025年10月4日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.3
/ M Tokens
輸出:
$
1.5
/ M Tokens

Qwen
聊天
Qwen3-VL-235B-A22B-Thinking
發行日期:2025年10月4日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.45
/ M Tokens
輸出:
$
3.5
/ M Tokens

Qwen
聊天
Qwen3-VL-30B-A3B-Instruct
發行日期:2025年10月5日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.29
/ M Tokens
輸出:
$
1.0
/ M Tokens

Qwen
聊天
Qwen3-VL-30B-A3B-Thinking
發行日期:2025年10月11日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.29
/ M Tokens
輸出:
$
1.0
/ M Tokens

Qwen
影像轉影片
Wan2.2-I2V-A14B
發行日期:2025年8月13日
總上下文:
0K
最大輸出:
輸入:
$
/ 影片
輸出:
$
/ 影片
