關於Qwen3-Omni-30B-A3B-Instruct
Qwen3-Omni-30B-A3B-Instruct 是來自阿里巴巴 Qwen 團隊最新 Qwen3 系列的成員。它是由 300 億個總參數和 30 億個有效參數組成的專家混合(MoE)模型,能夠在保持強大性能的同時有效降低推理成本。該模型在高品質、多來源、多語言數據上訓練,並展示了在多語種對話、程式碼和數學等基本能力中的卓越表現。
探索 Qwen3-Omni-30B-A3B-Instruct 的先進多模態和多語言能力如何解決複雜的現實世界問題。
多模態內容創作
生成和完善各種內容——文本、圖片、音頻、視頻——確保在所有格式中的一致性和品牌一致性。
使用案例範例:
"從文本簡報中,模型生成了一個營銷視頻腳本,選擇了相關的庫存圖片,並在三種語言中合成了一個自然音質的旁白,大大減少了製作時間。"
實時多語言支持
提供即時、自然音質的客戶支援,涵蓋多種語言和模態,包括語音、聊天和視頻分析。
使用案例範例:
"一位說法語的客戶通過視頻通話展示了故障設備;AI即時理解了問題,提供了用法語描述的診斷步驟,並顯示了相關示意圖。"
先進的媒體分析
從大量音頻和視頻檔案中提取深度、可行的洞察,識別物件、轉錄語音,並檢測複雜事件。
使用案例範例:
"自動索引數小時的監控視頻,識別特定車型,轉錄喧鬧環境中的對話,標記如玻璃破裂的不尋常聲音模式。"
互動學習與訓練
創建動態的、個性化的學習體驗,包含多模態反饋、問題解決和自適應內容傳遞。
使用案例範例:
"一個工程學生上傳了一張手寫的電路圖;AI口頭解釋了設計缺陷,指導他們進行修正,並對他們修訂的圖紙提供了實時反饋。"
元數據
規格
狀態
Deprecated
架構
Multimodal MoE
經過校準的
否
專家並行
是
總參數
30B
啟用的參數
3B
推理
否
精度
FP8
上下文長度
66K
最大輸出長度
66K
與其他模型比較
看看這個模型與其他模型的對比如何。

Qwen
chat
Qwen3-VL-32B-Instruct
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
發行日期:2025年10月15日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.18
/ M Tokens
輸出:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
發行日期:2025年10月15日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.18
/ M Tokens
輸出:
$
2
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
發行日期:2025年10月4日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.3
/ M Tokens
輸出:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
發行日期:2025年10月4日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.45
/ M Tokens
輸出:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
發行日期:2025年10月5日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.29
/ M Tokens
輸出:
$
1
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
發行日期:2025年10月11日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.29
/ M Tokens
輸出:
$
1
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
發行日期:2025年8月13日
$
0.29
/ Video
