目录

今天,Qwen-Image——一个20B MMDiT基础模型——在SiliconFlow上正式上线。它同时支持图像生成和编辑,在复杂文本渲染方面取得了重大突破,同时提供精确图像编辑的性能和可靠的全方位图像能力。
无论您是使用多语言材料的内容创作者,还是构建文本集成视觉应用的开发者,Qwen-Image都提供精度和灵活性,可以将任何创意愿景带入生活。
使用SiliconFlow的Qwen-Image API,您可以期待:
经济实惠的定价: Qwen-Image $0.042/Image。
卓越的文本渲染: 支持字母语言(例如英语)和表意文字语言(例如中文)具有高度保真度。
关键能力和基准性能
与传统T2I模型在文本渲染上存在困难并且在详细编辑时容易破坏图像一致性不同,Qwen-Image被设计为支持:
高级文本渲染: Qwen-Image擅长复杂文本渲染,包括多行布局、段落级语义和细粒度细节。它可以生成完整的文档、海报设计和其他复杂的文本布局,从标题到脚注确保精确渲染。
一致的图像编辑: 在编辑操作中,它在保持语义意义和视觉真实感方面表现出色。这意味着当用户调整图像时,例如更改产品背景、在海报上添加文本或在设计草稿中微调细节,Qwen-Image使图像的其余部分保持完整和自然,确保编辑与原始图片无缝融合。
多风格图像生成: Qwen-Image支持从写实、印象派到动漫和极简主义的一系列艺术风格,使其成为艺术家、设计师和讲故事者的灵活工具。
Qwen-Image展示了强大的Multimodal能力,在图像生成、编辑和文本渲染基准方面超越了顶级模型,如GPT Image 1和FLUX.1 Dev:
在图像生成中,它获得0.91 的GenEval和88.32 DPG的高分,领先领域。
对于图像编辑,它在GSO (15.11)和GEdit (EN: 7.56 /CN: 7.52)方面成绩优秀。
在文本渲染中,尤其在中文中,它取得了领先的分数:0.946 在LongText-ZH,0.963 在OneIG-Render-ZH和0.583 在ChineseWord-ZH。

在SiliconFlow上的真实性能
文本渲染
无论是日本传统拉面店的木招牌,还是现代书店的英文展览,Qwen-Image都能准确地跨语言渲染文本。

日本传统街景,傍晚时分,一家温馨的拉面店,突出的木制招牌上清晰准确地显示着 "麺屋 さくら" 的日文。

提示:生成一个精致的书店内部场景,暖色调光照,木制书架,充满吸引力的阅读氛围。在中心书架上展示《海洋梦》、《午夜都市》和《秘密花园》三本书作为推广亮点。
多风格图像生成
这些示例展示了在巴洛克、Makoto Shinkai风格和传统中国水墨山水画中的图像生成,反映了该模型对各种艺术风格的深刻理解和对细节的细致关注。

提示:一幅巴洛克风格的美丽景观场景——戏剧性的明暗对比照明,金色光芒,精致的细节,背景中的古典欧洲建筑,丰富的油画纹理,极具细节和庄严的氛围。

提示:一幅Makoto Shinkai风格的美丽景观场景——电影般的动漫外观,生动的色彩,明亮的日落天空,水面上闪闪发光的反射,柔和的云彩,情感和梦幻般的氛围,现代生活的微妙元素,例如远处的列车、城市天际线或电线。

提示:一幅传统中国水墨画风格的美丽景观场景——单色水墨,山雾,流动的河流,松树,古代塔楼,优雅的笔触,大面积留白,极简和诗意的氛围。
立即开始
1. 探索:在Qwen-Image中进行尝试,在SiliconFlow模型广场中体验。
2. 集成:使用我们的OpenAI兼容API。在SiliconFlow API文档中探索完整的API规范。
从文本到惊艳图像,Qwen-Image将想法变为现实——在SiliconFlow,我们期待看到我们的社区将创造出哪些惊人的作品!
准备好探索了吗?
