關於Qwen-Image-Edit
Qwen-Image-Edit 是 Qwen-Image 的圖像編輯版本,由阿里巴巴的 Qwen 團隊發布。基於 20B Qwen-Image 模型,進一步訓練其將其獨特的文本渲染能力擴展到圖像編輯任務,使得圖像中的文本編輯更加精確。此外,Qwen-Image-Edit 採用了創新的架構,將輸入圖像同時輸入到 Qwen2.5-VL(用於視覺語義控制)和 VAE 編碼器(用於視覺外觀控制),實現了語義和外觀編輯的能力。這使得它不僅支持低層次的視覺外觀編輯,如添加、移除或修改元素,還支持高層次的視覺語義編輯,如IP創建和風格轉換,這需要保持語義一致性。模型在多個公共基準上取得了最先進 (SOTA) 的表現,確立了它作為圖像編輯的強大基礎模型的地位。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.04
每張圖片
元數據
規格
狀態
Available
架構
經過校準的
是
專家並行
否
總參數
20B
啟用的參數
20B
推理
否
精度
FP8
上下文長度
0K
最大輸出長度
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
不支持
結構化輸出
不支持
工具
不支持
中間填充補全
不支持
聊天前綴補全
不支持
與其他模型比較
看看這個模型與其他模型的對比如何。

Qwen
chat
Qwen3-VL-32B-Instruct
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
發行日期:2025年10月21日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.2
/ M Tokens
輸出:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
發行日期:2025年10月15日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.18
/ M Tokens
輸出:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
發行日期:2025年10月15日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.18
/ M Tokens
輸出:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
發行日期:2025年10月4日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.3
/ M Tokens
輸出:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
發行日期:2025年10月4日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.45
/ M Tokens
輸出:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
發行日期:2025年10月5日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.29
/ M Tokens
輸出:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
發行日期:2025年10月11日
總上下文:
262K
最大輸出:
262K
輸入:
$
0.29
/ M Tokens
輸出:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
發行日期:2025年8月13日
$
0.29
視頻
