

Perbandingan Model
Qwen3-VL-32B-Instruct
vs
Ring-flash-2.0
28 Feb 2026

Harga
Input
$
0.2
/ M Tokens
$
0.14
/ M Tokens
Output
$
0.6
/ M Tokens
$
0.57
/ M Tokens
Metadata
Buat di
19 Okt 2025
19 Sep 2025
Lisensi
APACHE-2.0
MIT LICENSE
Penyedia
Qwen
inclusionAI
Spesifikasi
Negara
Available
Available
Arsitektur
MoE
Mixture-of-Experts (MoE) with 1/32 expert activation ratio and MTP layers, featuring low activation and high sparsity design
Terkalibrasi
Tidak
Ya
Campuran Ahli
Ya
Ya
Total Parameter
32B
100B
Parameter yang Diaktifkan
6.1B
Penalaran
Tidak
Tidak
Precision
FP8
FP8
Text panjang konteks
262K
131K
Max Tokens
262K
131K
Didukung Keberfungsian
Serverless
didukung
didukung
Serverless LoRA
Tidak didukung
Tidak didukung
Fine-tuning
Tidak didukung
Tidak didukung
Embeddings
Tidak didukung
Tidak didukung
Rerankers
Tidak didukung
Tidak didukung
Dukung Image Input
Tidak didukung
Tidak didukung
JSON Mode
didukung
Tidak didukung
Output Terstruktur
Tidak didukung
Tidak didukung
Alat
didukung
Tidak didukung
Fim Completion
Tidak didukung
Tidak didukung
Chat Prefix Completion
didukung
didukung
Qwen3-VL-32B-Instructdalam Perbandingan
Lihat bagaimana Qwen3-VL-32B-Instructmembandingkan dengan model populer lainnya di berbagai dimensi kunci.
