Qwen3-235B-A22B-Thinking-2507
Tentang Qwen3-235B-A22B-Thinking-2507
Qwen3-235B-A22B-Thinking-2507 adalah anggota dari seri Model bahasa besar Qwen3 yang dikembangkan oleh tim Qwen Alibaba, yang mengkhususkan diri dalam tugas-tugas penalaran yang sangat kompleks. Model ini dibangun di atas arsitektur Mixture-of-Experts (MoE), dengan total 235 miliar parameter dan sekitar 22 miliar parameter teraktivasi per token, yang meningkatkan efisiensi komputasi sambil mempertahankan kinerja yang kuat. Sebagai Model 'thinking' yang berdedikasi, ia menunjukkan peningkatan kinerja yang signifikan pada tugas-tugas yang membutuhkan keahlian manusia, seperti penalaran logis, matematika, sains, pengkodean, dan tolok ukur akademis, mencapai hasil mutakhir di antara model thinking sumber terbuka. Selain itu, Model ini memiliki kemampuan umum yang ditingkatkan seperti mengikuti instruksi, penggunaan alat, dan generasi Text, dan mendukung secara native kemampuan pemahaman konteks panjang 256K, menjadikannya ideal untuk skenario-skenario yang memerlukan penalaran mendalam dan pemrosesan dokumen yang panjang.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.13
/
$
0.6
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Ya
Campuran Ahli
Ya
Total Parameter
235B
Parameter yang Diaktifkan
22B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
262K
Max Tokens
262K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
didukung
Output Terstruktur
Tidak didukung
Alat
didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

Qwen
chat
Qwen3-VL-32B-Instruct
Dirilis pada: 21 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
Dirilis pada: 21 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
Dirilis pada: 15 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
Dirilis pada: 15 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
Dirilis pada: 4 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
Dirilis pada: 4 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
Dirilis pada: 5 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
Dirilis pada: 11 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
Dirilis pada: 13 Agu 2025
$
0.29
/ Video
