关于Qwen3-Omni-30B-A3B-Instruct
Qwen3-Omni-30B-A3B-Instruct 是阿里巴巴 Qwen 团队最新 Qwen3 系列中的一员。它是一个专家混合(MoE)模型,具有 300 亿个总参数和 30 亿个活跃参数,可以有效降低推理成本,同时保持强大的性能。该模型经过基于高质量、多来源和多语言数据的训练,在多语言对话等基本能力以及代码、数学等方面表现出色。
探索Qwen3-Omni-30B-A3B-Instruct的高级Multimodal和多语言能力如何解决复杂的现实世界问题。
Multimodal内容创作
生成并完善多样化内容——Text,Images,Audio,Video——确保所有格式的一致性和品牌一致性。
使用案例示例:
"从Text简报中,模型生成了一个营销Video脚本,选择了相关的库存Images,并用三种语言合成了自然声音的旁白,大大减少了生产时间。"
实时多语言支持
在多种语言和模态下提供即时自然语言的客户帮助,包括语音、Chat和Video分析。
使用案例示例:
"一个说法语的客户通过Video通话展示了一个故障设备;AI立即理解问题,以法语提供口头故障排除步骤,并显示相关的图解。"
高级媒体分析
从大量Audio和Video档案中提取深刻的可操作见解,识别物体,转录语音,并检测复杂事件。
使用案例示例:
"自动索引了数小时的安全录像,识别特定车辆模型,转录噪音环境中的对话,并标记异常的声音模式,如玻璃破碎。"
互动学习与培训
通过Multimodal反馈、问题解决和自适应内容交付创建动态、个性化的学习体验。
使用案例示例:
"一位工程学学生上传了一张手绘电路图;AI口头解释了设计缺陷,指导他们进行修正,并对他们修正后的图纸提供实时反馈。"
元数据
规格
州
Deprecated
建筑
Multimodal MoE
校准的
不
专家混合
是
总参数
30B
激活的参数
3B
推理
不
精度
FP8
上下文长度
66K
最大输出长度
66K
与其他模型进行比较
看看这个模型与其他模型相比表现如何。

Qwen
chat
Qwen3-VL-32B-Instruct
发行日期:2025年10月21日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
发行日期:2025年10月21日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
发行日期:2025年10月15日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
发行日期:2025年10月15日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
发行日期:2025年10月4日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
发行日期:2025年10月4日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
发行日期:2025年10月5日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
发行日期:2025年10月11日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
发行日期:2025年8月13日
$
0.29
/ Video
