關於Qwen3-235B-A22B-Thinking-2507
Qwen3-235B-A22B-Thinking-2507 是阿里巴巴的 Qwen 團隊開發的 Qwen3 大型語言模型系列的成員,專門用於進行高度複雜的推理任務。模型基於專家合併(MoE)架構構建,具有 2350 億個總參數和每個代幣約 220 億個激活參數,該設計在保持強大性能的同時提高計算效能。作為專門的‘思維’模型,它在需要人類專業知識的任務上表現顯著提升,例如邏輯推理、數學、科學、編碼和學術基準,在開源思維模型中實現了最先進的結果。此外,模型具備增強的一般能力,如指令跟隨、工具使用和文本生成,並且原生支持 256K 長上下文理解能力,使其理想適用於需要深度推理和處理長文檔的方案。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.13
/
$
0.6
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
可用
架構
經過校準的
是
專家並行
是
總參數
235B
啟用的參數
22B
推理
不
精度
FP8
上下文長度
262K
最大輸出長度
262K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
支持
結構化輸出
不支持
工具
支持
中間填充補全
不支持
聊天前綴補全
支持
與其他模型比較
看看這個模型與其他模型的對比如何。

Qwen
聊天
Qwen3-VL-32B-Instruct
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
0.6
/ M Tokens

Qwen
聊天
Qwen3-VL-32B-Thinking
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
1.5
/ M Tokens

Qwen
聊天
Qwen3-VL-8B-Instruct
發行日期:2025年10月15日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.18
/ M Tokens
輸出:
$
0.68
/ M Tokens

Qwen
聊天
Qwen3-VL-8B-Thinking
發行日期:2025年10月15日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.18
/ M Tokens
輸出:
$
2.0
/ M Tokens

Qwen
聊天
Qwen3-VL-235B-A22B-Instruct
發行日期:2025年10月4日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.3
/ M Tokens
輸出:
$
1.5
/ M Tokens

Qwen
聊天
Qwen3-VL-235B-A22B-Thinking
發行日期:2025年10月4日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.45
/ M Tokens
輸出:
$
3.5
/ M Tokens

Qwen
聊天
Qwen3-VL-30B-A3B-Instruct
發行日期:2025年10月5日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.29
/ M Tokens
輸出:
$
1.0
/ M Tokens

Qwen
聊天
Qwen3-VL-30B-A3B-Thinking
發行日期:2025年10月11日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.29
/ M Tokens
輸出:
$
1.0
/ M Tokens

Qwen
影像轉影片
Wan2.2-I2V-A14B
發行日期:2025年8月13日
總上下文:
0K
最大輸出:
輸入:
$
/ 影片
輸出:
$
/ 影片
