
Qwen
Image-to-Image
Qwen-Image-Edit
發行日期:2025年9月18日
Qwen-Image-Edit 是由阿里巴巴的 Qwen 團隊發佈的 Qwen-Image 的圖像編輯版本。基於 20B Qwen-Image 模型,它進一步訓練以擴展其獨特的文本渲染能力至圖像編輯任務,使能夠在圖像中進行精確的文本編輯。此外,Qwen-Image-Edit 利用創新的架構,將輸入圖像同時送入 Qwen2.5-VL(用於視覺語義控制)和 VAE 編碼器(用於視覺外觀控制),實現語義和外觀編輯的能力。這使它不僅支持添加、移除或修改元素等低階視覺外觀編輯,還支持如知識產權創建和風格轉移這樣需要保持語義一致性高階視覺語義編輯。模型在多個公共基準上取得了先進的成果,成為圖像編輯強大的基礎模型。...
總上下文:
0K
最大輸出:
輸入:
$
\/ 圖片
輸出:
$
\/ 圖片

Black Forest Labs
Image-to-Image
FLUX.1-Kontext-dev
發行日期:2025年6月27日
FLUX.1 Kontext [dev] 是由 Black Forest Labs 開發的 120 億參數圖像編輯模型。基於先進的流量匹配技術,它作為一種擴散變壓器,能夠根據文本指令進行精確的圖像編輯。模型的核心特徵是其強大的上下文理解能力,使其能夠同時處理文本和圖像輸入,並在多次後續編輯中保持角色、風格和物體的一致性,視覺漂移最小。作為一個開放權重模型,FLUX.1 Kontext [dev] 旨在推動新的科學研究,使開發人員和藝術家能夠創新工作流程。用戶可以利用它進行各種任務,包括風格轉換、物體修改、背景更換,甚至文本編輯...
總上下文:
0K
最大輸出:
輸入:
$
\/ 圖片
輸出:
$
\/ 圖片

