Qwen3-Omni-30B-A3B-Captioner

Qwen3-Omni-30B-A3B-Captioner

Qwen/Qwen3-Omni-30B-A3B-Captioner

정보에 대해서Qwen3-Omni-30B-A3B-Captioner

Qwen3-Omni-30B-A3B-Captioner는 Alibaba의 Qwen 팀에서 Qwen3 시리즈의 일환으로 개발한 Vision-언어 Model (VLM)입니다. 이는 고품질, 상세하고 정확한 이미지 캡션 생성을 위해 특별히 설계되었습니다. 30B 총 파라미터 전문가 혼합(MoE) 아키텍처 기반의 이 모델은 이미지 내용을 깊이 이해하고 그것을 풍부하고 자연스러운 언어 Text로 번역할 수 있습니다.

사용 가능한 Serverless

쿼리를 즉시 실행하고 사용한 만큼만 지불하세요.

$

0.1

/

$

0.4

1M 토큰당 (Input/Output)

메타데이터

생성하다

2025. 10. 4.

라이센스

-

공급자

Qwen

사양

Available

건축

교정된

전문가의 혼합

총 매개변수

30B

활성화된 매개변수

추론

아니요

Precision

FP8

콘텍스트 길이

66K

Max Tokens

66K

지원됨 기능

Serverless

지원됨

Serverless LoRA

지원하지 않음

Fine-tuning

지원하지 않음

Embedding

지원하지 않음

Rerankers

지원하지 않음

지원 Image Input

지원됨

JSON Mode

지원됨

구조화된 Outputs

지원하지 않음

도구

지원됨

Fim Completion

지원됨

Chat Prefix Completion

지원됨

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow