Perbandingan Model

Qwen2.5-VL-72B-Instruct

vs

Qwen3-Omni-30B-A3B-Thinking

28 Feb 2026

Harga

Input

$

0.59

/ M Tokens

$

0.1

/ M Tokens

Output

$

0.59

/ M Tokens

$

0.4

/ M Tokens

Metadata

Buat di

27 Jan 2025

15 Sep 2025

Lisensi

-

-

Penyedia

Qwen

Qwen

Spesifikasi

Negara

Available

Available

Arsitektur

Vision-Language Model (VLM) with a Streamlined and Efficient Vision Encoder (ViT with window attention, SwiGLU, RMSNorm) aligned with the Qwen2.5 LLM structure. Features include Dynamic Resolution and Frame Rate Training for video understanding, mRoPE for temporal sequence and speed, and YaRN for long text context length extrapolation.

Thinker-Talker, MoE-based

Terkalibrasi

Tidak

Tidak

Campuran Ahli

Tidak

Ya

Total Parameter

72B

30B

Parameter yang Diaktifkan

72B

30B

Penalaran

Tidak

Tidak

Precision

FP8

FP8

Text panjang konteks

131K

66K

Max Tokens

4K

66K

Didukung Keberfungsian

Serverless

didukung

didukung

Serverless LoRA

Tidak didukung

Tidak didukung

Fine-tuning

Tidak didukung

Tidak didukung

Embeddings

Tidak didukung

Tidak didukung

Rerankers

Tidak didukung

Tidak didukung

Dukung Image Input

Tidak didukung

Tidak didukung

JSON Mode

Tidak didukung

didukung

Output Terstruktur

Tidak didukung

Tidak didukung

Alat

Tidak didukung

didukung

Fim Completion

Tidak didukung

didukung

Chat Prefix Completion

didukung

didukung

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow