关于Qwen-Image
Qwen-Image 是由阿里巴巴 Qwen 团队发布的图像生成基础模型,具有 200 亿参数。该模型在复杂文本渲染和精确图像编辑方面取得了显著进展,特别擅长生成具有高保真中文和英文 Text 的 Image。Qwen-Image 能够处理多行布局和段落级 Text,同时在生成的 Image 中保持布局一致性和上下文和谐。除了其卓越的 Text 渲染能力外,该模型支持从写实场景到动画美学的各种艺术风格,能够灵活适应各种创意提示。它还具有强大的图像编辑和理解能力,支持诸如风格转移、对象插入或移除、细节增强、Text 编辑,甚至人类姿态操控等高级操作,旨在成为一个综合基础模型,用于智能视觉创作和操控,其中语言、布局和影像汇聚交融。
可用的 Serverless
立即运行查询,仅按使用量付费
$
0.02
每 Image
元数据
规格
州
Available
建筑
校准的
不
专家混合
不
总参数
20B
激活的参数
20B
推理
不
精度
FP8
上下文长度
0K
最大输出长度
支持功能
Serverless
支持
Serverless LoRA
不支持
微调
不支持
Embeddings
不支持
Rerankers
不支持
支持 Image Input
不支持
JSON Mode
不支持
结构化Outputs
不支持
工具
不支持
FIM 补全
不支持
对话前缀补全
不支持
与其他模型进行比较
看看这个模型与其他模型相比表现如何。

Qwen
chat
Qwen3-VL-32B-Instruct
发行日期:2025年10月21日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
发行日期:2025年10月21日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
发行日期:2025年10月15日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
发行日期:2025年10月15日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
发行日期:2025年10月4日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
发行日期:2025年10月4日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
发行日期:2025年10月5日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
发行日期:2025年10月11日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
发行日期:2025年8月13日
$
0.29
/ Video
