Qwen3-VL-32B Sekarang di SiliconFlow: Kecerdasan Tingkat Unggulan dengan Efisiensi Model Padat

28 Okt 2025

Daftar Isi

TL;DR: Qwen3-VL-32B — penambahan terbaru pada keluarga Qwen3-VL — sekarang tersedia di SiliconFlow. Dengan hanya 32B parameter padat, ia mencapai penalaran multimodal dan pemahaman tingkat flagship, mengungguli GPT-5 mini dan Claude 4 Sonnet sambil memberikan respon lebih cepat, biaya lebih rendah, dan keseimbangan luar biasa antara efisiensi dan performa. Mulai bangun hari ini melalui SiliconFlow's OpenAI**/API yang kompatibel dengan Anthropic**, dan buka kinerja level padat dengan kecerdasan flagship.

Membangun kesuksesan dari model Qwen3-VL-235B dan Qwen3-VL-8B yang sudah tersedia di SiliconFlow, Qwen3-VL-32B semakin memperkaya keluarga Qwen3-VL, melengkapi cakupan penuh di skenario pemahaman visi-bahasa — dari model ringan hingga tingkat flagship. Meskipun hanya menggunakan 32B parameter, ia mencapai kinerja sebanding dengan model sebesar 235B, dan bahkan melampaui mereka dalam tolok ukur seperti OSWorld, menunjukkan efisiensi dan kekuatan penalaran yang luar biasa.

Melalui API Qwen3-VL-32B SiliconFlow, Anda dapat mengharapkan:

Harga yang Efektif Biaya:
- Qwen3-VL-32B-Instruct: $0.2/M tokens (input) dan $0.6/M tokens (output)
- Qwen3-VL-32B-Thinking: $0.2/M tokens (input) dan $1.5/M tokens (output)
Dua Varian Model:
- Instruct: memberikan respons lebih cepat dan eksekusi yang lebih stabil, ideal untuk tugas percakapan dan panggilan alat.
- Thinking: meningkatkan penalaran rantai panjang dan pemahaman visual kompleks, mampu "melihat dan berpikir" melalui masalah multimodal yang menantang.
Jendela Konteks 262K: Memungkinkan pemrosesan dokumen panjang dan percakapan berulang tanpa hambatan.

Apakah Anda sedang mengeksplorasi penalaran visual, analisis dokumen, atau pengembangan agen multimodal, API Qwen3-VL-32B SiliconFlow membuatnya mudah untuk menghadirkan kecerdasan multimodal tingkat flagship ke dalam aplikasi dunia nyata.

Fitur Utama & Kinerja Benchmark

Seri Qwen3-VL memberdayakan kecerdasan multimodal di seluruh tugas — dari pemahaman visual, pembuatan konten hingga penalaran dan penciptaan kreatif, membuat melihat dan memahami dunia menjadi lebih ringan, lebih cepat, dan lebih cerdas.

Membangun pada fondasi ini, seri Qwen3-VL-32B mencapai tingkat baru dalam tolok ukur multimodal dan teks-penuh, menggabungkan efisiensi level padat dengan kinerja grade flagship:

Kinerja Multimodal: Qwen3-VL-32B unggul dalam penalaran STEM, VQA, OCR, pemahaman video, dan tugas agentic, secara konsisten mengungguli GPT-5 mini dan Claude 4 Sonnet di berbagai kategori utama.
Peringkat #1 pada OSWorld: menyoroti kemampuannya untuk "melihat, menalar, dan bertindak" di tugas visual-agentic yang kompleks.
Kinerja Tekstual & Penalaran: Qwen3-VL-32B juga menunjukkan penalaran teks-penuh yang luar biasa, menunjukkan kinerja yang kuat dalam pemahaman bahasa dan inferensi logis.

Sejauh ini, SiliconFlow menawarkan lini lengkap model Qwen3-VL, yang mencakup:

Model padat: Qwen3-VL-8B dan Qwen3-VL-32B
Model MoE: Qwen3-VL-30B-A3B dan Qwen3-VL-235B-A22B

Setiap model tersedia dalam varian Instruct dan Thinking, memungkinkan pengembang untuk secara fleksibel mengakses layanan API yang sesuai dan memilih keseimbangan yang tepat antara performa, efisiensi, dan kedalaman penalaran.

Skenario Aplikasi Dunia Nyata

Dibuat untuk pengembang dan peneliti, Qwen3-VL-32B membuka kemungkinan baru di seluruh aplikasi AI multimodal:

Pemahaman & Analisis Video: mengidentifikasi tindakan, merangkum adegan, dan melacak dinamika waktu dalam video panjang untuk otomatisasi atau kecerdasan media.
Penalaran Visual & Tugas STEM: menginterpretasikan diagram, grafik ilmiah, dan masalah matematika kompleks dengan penalaran kontekstual, ideal untuk pendidikan, penelitian, dan dokumentasi teknis.

Agen Multimodal: menghubungkan persepsi dan penalaran untuk membangun asisten cerdas yang mampu memahami gambar, menganalisis data, dan mengambil tindakan kontekstual.
Pemahaman Dokumen & OCR: mengekstrak dan merangkum informasi kunci dari dokumen pindaian, kwitansi, atau catatan tulisan tangan dengan presisi tinggi.

Mulai Segera

Jelajahi: Coba Qwen3-VL-32B di SiliconFlow playground.
Integrasikan: Gunakan API kami yang kompatibel dengan OpenAI. Jelajahi spesifikasi lengkap API di dokumentasi API SiliconFlow.

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)