目次
今日、Qwen-Image — 20B MMDiT基礎モデル — がSiliconFlowで正式に利用可能です。画像生成と編集の両方に対応しており、複雑なTextレンダリングにおける主要なブレークスルーを提供し、正確なImage編集のパフォーマンスと信頼できる全体的なImage機能を提供します。
多言語の素材を扱うコンテンツクリエイターやText統合ビジュアルアプリケーションを構築する開発者にとって、Qwen-ImageはあらゆるクリエイティブVisionを実現するためのPrecisionと柔軟性を提供します。
SiliconFlowのQwen-Image APIで期待できること:
予算に優しい価格設定: Qwen-Image $0.042/Image。
優れたTextレンダリング: アルファベット言語(例:英語)と表意文字言語(例:中国語)の両方を高忠実度でサポートします。
重要な機能とベンチマークパフォーマンス
従来のT2I ModelがTextレンダリングに苦労し、詳細な編集時にImageの一貫性を容易に破るのとは異なり、Qwen-Imageは以下をサポートするように設計されています:
優れたTextレンダリング: Qwen-Imageは、複雑なTextレンダリング、マルチラインのレイアウト、段落レベルのセマンティクス、細かいディテールのRenderingに秀でています。完全なドキュメント、ポスターのデザイン、その他の複雑なTextレイアウトを生成し、ヘッドラインからフッテージまで正確なレンダリングを保証します。
一貫したImage編集: 編集操作中にセマンティックな意味と視覚的リアリズムの両方を保持するという卓越したパフォーマンスを達成します。実践では、ユーザーが例えば製品背景の変更やポスターへのText追加、デザイン案の細部の修正を行うときに、Qwen-Imageは元の画像に自然に溶け込み、編集が自然かつ一貫性のある形で画像を保ちます。
マルチスタイルのImage生成: Qwen-Imageは、フォトリアリスティック、印象派、アニメ、ミニマリストなど、さまざまなアートスタイルに対応しており、アーティスト、デザイナー、ストーリーテラーに柔軟なツールを提供します。
Qwen-Imageは強力なMultimodal機能を示し、GPT Image 1やFLUX.1 DevなどのトップModelを上回り、ベンチマークにおけるImage生成、編集、Textレンダリングで優れた成果を上げています:
Image生成では、GenEvalで0.91、DPGで88.32を獲得し、分野をリードしています。
Image編集では、GSO (15.11)とGEdit (EN: 7.56 /CN: 7.52)をトップとします。
特に中国語におけるTextレンダリングでは、最先端のスコアを達成しています:LongText-ZHで0.946、OneIG-Render-ZHで0.963、ChineseWord-ZHで0.583。

SiliconFlowでの実際のパフォーマンス
Textレンダリング
日本の伝統的なラーメン店の木製の看板や英語の現代書店の展示会にかかわらず、Qwen-Imageは言語を越えてTextを正確にレンダリングします。

夕方の日本の伝統的な街並みシーン、居心地の良いラーメン店に「麺屋 さくら」という文字がはっきりと書かれた木製の看板が目立つ。

プロンプト: 温かい照明、木製の本棚、居心地の良い読書の雰囲気を備えた洗練された書店の内部シーンを生成します。中央の本棚には、『Ocean Dreams』、『Midnight City』、『The Secret Garden』の3冊をプロモーションハイライトとして表示します。
マルチスタイルのImage生成
例として、バロック、マコト・シンカイスタイル、伝統的な中国インク絵画のスタイルに基づくImage生成が示されており、様々な芸術スタイルへの深い理解と細心の注意を払ったモデルが反映されています。

プロンプト: バロックスタイルの美しい風景シーン — 劇的なキアロスクーロ照明、黄金色の輝き、豪華なディテール、背景にクラシックなヨーロッパ建築、豊かな油絵の質感、非常に詳細で荘厳な雰囲気。

プロンプト: マコト・シンカイスタイルの美しい風景シーン — 映画的なアニメの外見、鮮やかな色彩、輝く夕焼けの空、水面のきらめく反射、柔らかな雲、感情豊かで夢のような雰囲気、遠くの電車、都市のスカイライン、または送電線のような現代生活のさりげない要素を含む。

プロンプト: 伝統的な中国インク画スタイルの美しい風景シーン — モノクロのインクウォッシュ、霧に包まれた山々、流れる川、松の木、古代の塔、優雅な筆遣い、広い空白のスペース、ミニマリスティックで詩的な雰囲気。
すぐに始めましょう
1. 探索する: Qwen-ImageをSiliconFlow Playgroundでお試しください。
2. 統合する: OpenAI互換APIを使用してください。SiliconFlow API ドキュメンテーションで完全なAPI仕様を確認してください。
Textから見事なImageまで、Qwen-Imageはアイデアを実現させます — SiliconFlowで、皆さんの素晴らしい制作物を見るのが楽しみです!
探求を始める準備はできましたか?

