关于Qwen-Image-Edit
Qwen-Image-Edit是Qwen-Image的图像编辑版本,由阿里巴巴的Qwen团队发布。它建立在20B Qwen-Image模型之上,并进一步训练以将其独特的Text渲染能力扩展到图像编辑任务中,从而实现图像内的精确Text编辑。此外,Qwen-Image-Edit利用了一种创新的架构,将Input Image输入到Qwen2.5-VL(用于视觉语义控制)和VAE编码器(用于视觉外观控制),实现了语义和外观编辑的能力。这使其不仅支持像添加、删除或修改元素这样的低级视觉外观编辑,还支持IP创作和风格迁移等需要保持语义一致性的高级视觉语义编辑。该模型在多个公共基准上实现了最先进(SOTA)的性能,确立了其作为图像编辑的强大基础模型的地位。
可用的 Serverless
立即运行查询,仅按使用量付费
$
0.04
每 Image
元数据
规格
州
Available
建筑
校准的
是
专家混合
不
总参数
20B
激活的参数
20B
推理
不
精度
FP8
上下文长度
0K
最大输出长度
支持功能
Serverless
支持
Serverless LoRA
不支持
微调
不支持
Embeddings
不支持
Rerankers
不支持
支持 Image Input
不支持
JSON Mode
不支持
结构化Outputs
不支持
工具
不支持
FIM 补全
不支持
对话前缀补全
不支持
与其他模型进行比较
看看这个模型与其他模型相比表现如何。

Qwen
chat
Qwen3-VL-32B-Instruct
发行日期:2025年10月21日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
发行日期:2025年10月21日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
发行日期:2025年10月15日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
发行日期:2025年10月15日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
发行日期:2025年10月4日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
发行日期:2025年10月4日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
发行日期:2025年10月5日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
发行日期:2025年10月11日
上下文长度:
262K
最大输出长度:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
发行日期:2025年8月13日
$
0.29
/ Video
