Perbandingan Model

Qwen3-VL-32B-Instruct

vs

Ring-flash-2.0

28 Feb 2026

Harga

Input

$

0.2

/ M Tokens

$

0.14

/ M Tokens

Output

$

0.6

/ M Tokens

$

0.57

/ M Tokens

Metadata

Buat di

19 Okt 2025

19 Sep 2025

Lisensi

APACHE-2.0

MIT LICENSE

Penyedia

Qwen

inclusionAI

Spesifikasi

Negara

Available

Available

Arsitektur

MoE

Mixture-of-Experts (MoE) with 1/32 expert activation ratio and MTP layers, featuring low activation and high sparsity design

Terkalibrasi

Tidak

Ya

Campuran Ahli

Ya

Ya

Total Parameter

32B

100B

Parameter yang Diaktifkan

6.1B

Penalaran

Tidak

Tidak

Precision

FP8

FP8

Text panjang konteks

262K

131K

Max Tokens

262K

131K

Didukung Keberfungsian

Serverless

didukung

didukung

Serverless LoRA

Tidak didukung

Tidak didukung

Fine-tuning

Tidak didukung

Tidak didukung

Embeddings

Tidak didukung

Tidak didukung

Rerankers

Tidak didukung

Tidak didukung

Dukung Image Input

Tidak didukung

Tidak didukung

JSON Mode

didukung

Tidak didukung

Output Terstruktur

Tidak didukung

Tidak didukung

Alat

didukung

Tidak didukung

Fim Completion

Tidak didukung

Tidak didukung

Chat Prefix Completion

didukung

didukung

Qwen3-VL-32B-Instructdalam Perbandingan

Lihat bagaimana Qwen3-VL-32B-Instructmembandingkan dengan model populer lainnya di berbagai dimensi kunci.

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow