目錄
今天,Qwen-Image — 一個20B MMDiT基礎模型 — 正式在SiliconFlow上推出。它既可用於生成圖像,也可用於編輯圖像,並在複雜文本渲染方面實現重大突破,同時提供精確圖像編輯性能和可靠的全方位圖像能力。
無論您是搭建多語言材料的內容創作者,還是構建文本集成視覺應用的開發者,Qwen-Image都能提供精確性和靈活性,將任何創意構想帶入生活。
透過SiliconFlow的Qwen-Image API,您可以期待以下內容:
預算友好型定價: Qwen-Image $0.042/圖片。
卓越文本渲染: 支持字母語言(例如英語)和表意文字語言(例如中文)的高保真度渲染。
關鍵能力及基準性能
與傳統的T2I模型不同,Qwen-Image支持文本渲染並能在詳細編輯過程中保持圖像一致性:
優秀文本渲染: Qwen-Image擅長複雜文本渲染,包括多行佈局、段落級語義和細緻的細節。它可以生成完整文件、海報設計和其他複雜文本佈局,確保精確渲染從標題到腳註。
一致的圖像編輯: 在編輯操作中,它在保持語義意義和視覺真實性方面表現出色。實際應用中,這意味著當用戶調整圖片時 — 例如更改產品背景、在海報上添加文本或細化設計草圖的細節 — Qwen-Image保持圖像其他部分自然,確保編輯無縫融入原始圖片。
多風格圖像生成: Qwen-Image支持廣泛的藝術風格 — 從照片寫實、印象派到動漫和極簡主義 — 使其成為藝術家、設計師和故事講述者的靈活工具。
Qwen-Image展示了強大的多模態能力,超越了頂級模型如GPT Image 1和FLUX.1 Dev在圖像生成、編輯和文本渲染基準上的表現:
在圖像生成方面,它在GenEval中得到0.91的評分,在DPG中得到88.32,領先於市場。
對於圖像編輯,它在GSO (15.11)和GEdit (EN: 7.56 /CN: 7.52)中名列前茅。
在文本渲染方面,尤其是中文,它取得了最先進的分數:在LongText-ZH中得到0.946 ,在OneIG-Render-ZH中得到0.963,在ChineseWord-ZH中得到0.583。

SiliconFlow上的真實性能
文本渲染
無論是傳統日本拉麵店的木製招牌,還是英語現代書店展覽,Qwen-Image在跨語言文本渲染方面都能準確無誤。

晚上,日本傳統街景,一家溫馨拉麵店展示著醒目的木製招牌,清晰準確地呈現日文字 "麺屋 さくら"。

提示:生成一個精緻的書店內景,具備溫暖的照明、木質書架和誘人的閱讀氛圍。在中央書架上展示三本書:《海洋夢》、《午夜城市》和《秘密花園》作為促銷亮點。
多風格圖像生成
這些範例展示了巴洛克、 新海誠風格和中國傳統水墨畫風格的圖像生成,反映了該模型對各種藝術風格的深刻理解及對細節的細緻關注。

提示:一幅巴洛克風格的美麗風景——戲劇性的明暗對比照明,金色光輝,精緻細節,背景中的歐洲古典建築,豐富的油畫質感,細緻且宏偉的氛圍。

提示:一幅新海誠風格的美麗風景——電影般的動畫外觀,鮮豔的色彩,閃亮的夕陽天空,水面反射的光輝,柔和的雲朵,充滿情感和夢幻的氛圍,伴有現代生活的微妙元素,如遠處的火車、城市天際線或電線。

提示:一幅中國傳統水墨畫風格的美麗風景——單色墨洗,細霧山巒,流動的河流,松樹,古代塔樓,優雅的筆觸,大片空白,極簡且詩意氛圍。
立即開始
1. 探索:在SiliconFlow遊樂場中試試Qwen-Image。
2. 整合:使用我們的OpenAI兼容API。在SiliconFlow API文檔中探索完整API規格。
從文本到令人驚嘆的圖像,Qwen-Image將創意付諸於現實——在SiliconFlow,我們迫不及待想看到社群所創造的驚人作品!
準備好了嗎?

