目次
今日、Z-Image-Turbo — Alibaba Tongyiの最新の軽量6Bパラメータテキスト-ア-Imageモデル — がSiliconFlowで利用可能になりました。体系的な最適化とSingle-Stream Diffusion Transformerアーキテクチャを通じて、それはフォトリアリスティックなImage生成とバイリンガルなTextレンダリングを提供し、主要な商業モデルに匹敵する性能を示し、トップクラスの性能が大規模なModelサイズを必要としないことを証明しています。
クリエイティブなツール、マーケティング資産、または視覚AIアプリケーションを構築する際には、Z-Image-Turboは次のレベルへワークフローを進化させる速度とPrecisionを提供します。
SiliconFlowのZ-Image-TurboAPIにより、あなたは期待できます:
予算に優しい価格設定: Z-Image-Turboが$0.005/imageで利用可能。
極限効率: ディスティルされたModelとして、わずか8ステップでトップクラスの性能を提供し、競合他社に匹敵または超越します。
フォトリアリスティック & バイリンガル: フォトリアリスティックなImage生成と正確な英語 & 中国語のTextレンダリングで優れています。複雑な指示に強固に従うことができます。
SOTAパフォーマンス: Single-Stream Diffusion Transformerアーキテクチャによって、Alibaba AI Arena(エロベース評価)でのオープンソースモデル中で最高の結果を達成します。

主要な能力 & 現実世界のパフォーマンス
従来の基盤Modelが品質のために巨大なパラメータに依存したり、特定の文化的ニュアンスに苦労したりするのに対して、Z-Imageは効率性を再定義し、以下のサポートを設計されています:
効率的なフォトリアリスティック品質
Z-Image-Turboは、写真レベルのリアリズムでImageを生成することに優れ、詳細、照明、テクスチャーの細かい制御を示します。高忠実度を美的品質と構成と全体の雰囲気でバランスしています。
以下の例に示されるように、Modelは氷の中の複雑な光の屈折、実物の人間の特徴、絹の繊細な光陰と流れるような折り目など、複雑な視覚現象を驚くほど正確に処理します。

すべての画像はSiliconFlowプラットフォーム上のZ-Image-Turboを使用して生成されました
優れたバイリンガルTextレンダリング
顔のリアリズムと全体の美学的構成を保ちながら、英語と中国語のTextを正確にレンダリングすることができ、トップクラスのクローズドソースモデルに匹敵する結果を提供します。ポスターデザインでは、強力な構成スキルと良いタイポグラフィー感覚を示します。小さなフォントサイズの挑戦的なシナリオでも高品質なTextをレンダリングし、Text的に精密かつ視覚的に魅力的なデザインを提供します。
SiliconFlowプラットフォーム上で生成されたポスターで示されているように、Modelは印象的な明確さとスタイルでTextをレンダリングし、正確なタイポグラフィーを強力な芸術的美学と結びつけるレイアウトを提供し、編集物やリアリスティックでカートゥーン風のデザインを含めて。

豊かな世界知識と文化的理解
Z-Imageは、世界の知識と多様な文化的コンセプトの広範な理解を持っています。これにより、有名なランドマーク、よく知られたキャラクター、特定の実際のオブジェクトを含む幅広い主題を正確に生成できます。
私たちの例で示されるように、Modelはヴェネツィアカーニバルの衣装や雰囲気、ヴェネツィアのゴンドラのような象徴的なオブジェクト、エッフェル塔のような世界的に有名なランドマークをすべて印象的な正確さとスタイルの忠実度でキャプチャします。

すぐに始めましょう
探求: Z-ImageをSiliconFlow Playgroundで試してみてください。
統合: OpenAI互換のAPIを使用してください。SiliconFlow APIのドキュメントで完全なAPI仕様を探してください。

