Qwen-Image가 SiliconFlow에 있습니다: 우수한 Text 렌더링 및 정밀 Image 편집

2025. 9. 22.

목차

Qwen-Image가 SiliconFlow에 있습니다
Qwen-Image가 SiliconFlow에 있습니다

오늘 Qwen-Image — 20B MMDiT 기초 모델 — 이 SiliconFlow에서 공식적으로 제공됩니다. 이미지 생성 및 편집 모두를 위해 구축된 이 모델은 복잡한 텍스트 렌더링에서 주요한 발전을 이루었으며, 또한 정확한 이미지 편집 성능과 뛰어난 전반적인 이미지 기능을 제공합니다.


여러분이 다국어 자료를 다루는 콘텐츠 제작자이든 텍스트 통합 시각 응용 프로그램을 구축하는 개발자이든, Qwen-Image는 어떤 창의적 Vision도 실현할 수 있는 Precision과 유연성을 제공합니다.


SiliconFlow의 Qwen-Image API를 사용하면 다음과 같은 것을 기대할 수 있습니다:

  • 예산 친화적인 가격: Qwen-Image $0.042/Image.

  • 예외적인 Text 렌더링: 알파벳 언어(예: 영어)와 표의문자 언어(예: 중국어) 모두를 높은 정확도로 지원합니다.



주요 기능 및 벤치마크 성능


전통적인 T2I 모델들이 텍스트 렌더링에서 어려움을 겪고 세부 수정 중 이미지 일관성을 쉽게 깨뜨리는 것과는 달리, Qwen-Image는 다음을 지원하도록 설계되었습니다:


  • 우수한 Text 렌더링: Qwen-Image는 복잡한 텍스트 렌더링, 다중 라인 레이아웃, 단락 수준의 의미론 및 세밀한 디테일에 탁월합니다. 완벽한 문서, 포스터 디자인, 기타 복잡한 텍스트 레이아웃을 생성할 수 있으며, 헤드라인에서 각주까지 정확한 렌더링을 보장합니다.

  • 일관된 Image 편집: 편집 작업 중 의미론적 의미와 시각적 현실성을 모두 유지하는 뛰어난 성능을 발휘합니다. 실제로, 사용자가 이미지를 수정할 때 예를 들어 제품 배경을 변경하거나 포스터에 텍스트를 추가하거나 디자인 초안에서 세부사항을 조정할 때, Qwen-Image는 이미지의 나머지 부분을 자연스럽게 유지하여 원본 사진과 원활히 합쳐지도록 보장합니다.

  • 다양한 스타일의 이미지 생성: Qwen-Image는 사실적이고 인상파적인 것부터 애니메이션 스타일과 미니멀한 것에 이르기까지 다양한 예술적 스타일을 지원하여 아티스트, 디자이너, 스토리텔러에게 유연한 도구가 됩니다.


Qwen-Image는 강력한 Multimodal 기능을 보여주며 GPT Image 1FLUX.1 Dev와 같은 상위 Model을 초과 성능을 발휘하며 이미지 생성, 편집 및 텍스트 렌더링 벤치마크에서 뛰어납니다:


  • 이미지 생성에서 GenEval에서 0.91 점수와 88.32 DPG를 기록하여 분야를 선도합니다.

  • 이미지 편집에서는 GSO (15.11)과 GEdit (EN: 7.56 /CN: 7.52)에서 높은 점수를 받습니다.

  • 특히 중국어에서 텍스트 렌더링에서는 최첨단 점수를 달성합니다: LongText-ZH에 0.946, OneIG-Render-ZH에 0.963, ChineseWord-ZH에 0.583.


Image


SiliconFlow에서의 실전 성능


Text 렌더링


전통적인 일본 라멘 가게의 나무 간판이든 현대식 서점 전시든, Qwen-Image는 언어를 넘어서 텍스트를 정확하게 렌더링합니다.


Image

전통적인 일본 거리 풍경에서 저녁, 아늑한 라멘 가게가 두드러진 목재 간판과 명확하며 정확한 일본어 텍스트 "麺屋 さくら"로 특징지어져 있습니다.


Image

프롬프트: 따뜻한 조명, 목재 책꽂이 및 매력적인 독서 분위기가 있는 정교한 서점 내부 장면 생성. 중앙 책꽂이에는 프로모션 하이라이트로 오션 드림즈, 미드나이트 시티 및 더 시크릿 가든의 세 권의 책을 전시합니다.



다양한 스타일의 이미지 생성


예제는 바로크, 신카이 마코토 스타일 및 전통 중국 잉크 풍경화에 이미지 생성을 보여주며, 다양한 예술적 스타일에 대한 모델의 깊은 이해와 세세한 부분에 대한 세심한 배려를 반영합니다.

프롬프트: 바로크 스타일의 아름다운 풍경 장면 — 극적인 명암 대비 조명, 황금빛, 화려한 디테일, 클래식한 유럽 건축물 배경, 풍부한 유화 질감, 고도로 세세하고 웅장한 분위기.


Image

프롬프트: 신카이 마코토 스타일의 아름다운 풍경 장면 — 영화 같은 애니메이션 룩, 밝은 색상, 빛나는 노을 하늘, 물에 반짝이는 반사, 부드러운 구름, 감정적이고 꿈꾸는 듯한 분위기, 먼 기차, 도시 스카이라인 또는 전력선과 같은 현대 생활의 미묘한 요소를 포함.


Image

프롬프트: 전통 중국 잉크화 스타일의 아름다운 풍경 장면 — 흑백 잉크 워시, 안개 낀 산, 흐르는 강, 소나무, 고대 파고다, 우아한 붓놀림, 넓은 빈 공간, 미니멀리즘과 시적인 분위기.



즉시 시작하기


  1. 1. 탐색하기: Qwen-ImageSiliconFlow Playground에서 사용해보세요.

  2. 2. 통합하기: OpenAI 호환 API를 사용하세요. SiliconFlow API 문서에서 전체 API 사양을 탐색하세요.


import requestsurl = "https://api.siliconflow.com/v1/images/generations"payload = {    "batch_size": 1,    "num_inference_steps": 20,    "guidance_scale": 7.5,    "model": "Qwen/Qwen-Image",    "prompt": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea"}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())


텍스트에서 멋진 이미지로, Qwen-Image는 아이디어를 생생하게 표현합니다. 그리고 SiliconFlow에서 우리 커뮤니티가 만들어낼 멋진 창작물이 너무 기대됩니다!


탐색할 준비가 되셨습니까?


비즈니스 또는 판매 문의→

지금 Discord 커뮤니티에 참여하세요→

최신 업데이트를 위해 X에서 팔로우하세요→

SiliconFlow에서 사용할 수 있는 모든 모델 탐색하기→

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow