关于Qwen3-30B-A3B
Qwen3-30B-A3B 是 Qwen 系列的最新大型语言模型,具有专家混合(MoE)架构,总参数为 30.5B,激活参数为 3.3B。此模型独特地支持在思考模式(用于复杂逻辑推理、数学和编码)和非思考模式(用于高效的通用对话)之间无缝切换。它显著增强了推理能力,在创作写作、角色扮演和多轮对话中的人类偏好对齐方面表现出色。该模型在与外部工具的精确集成中的代理能力方面表现卓越,并支持 100 多种语言和方言,具有强大的多语言指令遵循和翻译能力。
探索Qwen3-30B-A3B独特的双模架构和高级推理如何高效解决复杂的实际问题。
高级科学问题解决
利用'思考模式'进行复杂数据分析、数学证明生成和理论验证,加速研究周期。
用例示例:
"协助生物信息学团队通过推理基因组数据来识别新的蛋白质交互,在'思考模式'中制定和验证复杂统计模型以验证假设。"
智能代码生成与调试
利用'思考模式'进行深入代码分析,识别微妙的逻辑错误,并优化各种编程语言和架构的性能。
用例示例:
"通过跟踪执行路径诊断Rust微服务中的并发错误,并建议优化的异步模式,通过Agent能力集成到CI/CD管道。"
动态多语言内容创作
生成100多种语言的高质量、文化适应内容,无缝切换'思考模式'用于复杂叙述和'非思考模式'用于高效翻译。
用例示例:
"在日语、德语和西班牙语中制作了一系列营销活动,使用'思考模式'进行细致的文化适应和'非思考模式'进行核心信息的快速、准确翻译。"
战略商业智能与报告
在'思考模式'下对市场数据和财务报告进行多步骤定量分析,然后在'非思考模式'下生成简洁、可操作的战略建议和报告。
用例示例:
"分析全球供应链数据以预测市场变化,然后在'非思考模式'下生成详细的执行总结,详细说明跨国公司可能面临的风险和机会。"
自动法律和监管合规
通过'思考模式'进行逻辑推理,审核复杂法律文件和监管框架,识别不一致并标记潜在的合规问题。
用例示例:
"审查了大量GDPR合规文件,为SaaS平台识别潜在的数据隐私违规,通过逻辑推导建议补救步骤,集成到法律数据库。"
增强代理工作流自动化
通过'思考模式'进行规划和问题解决,以及'非思考模式'执行例行操作,集成外部工具和API以自动化复杂的多步骤任务。
用例示例:
"自动化客户支持工作流:'思考模式'分析复杂查询并识别根本原因,然后'非思考模式'触发相关CRM操作并起草个性化响应。"
元数据
规格
州
Deprecated
建筑
Mixture of Experts
校准的
是
专家混合
是
总参数
30B
激活的参数
3.3B
推理
不
精度
FP8
上下文长度
131K
最大输出长度
131K
与其他模型进行比较
看看这个模型与其他模型相比表现如何。

Qwen
chat
Qwen3-VL-32B-Instruct
发行日期:2025年10月21日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
发行日期:2025年10月21日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
发行日期:2025年10月15日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
发行日期:2025年10月15日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
发行日期:2025年10月4日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
发行日期:2025年10月4日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
发行日期:2025年10月5日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
发行日期:2025年10月11日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
发行日期:2025年8月13日
$
0.29
/ Video
