Qwen3-Next-80B-A3B-Thinking
Tentang Qwen3-Next-80B-A3B-Thinking
Qwen3-Next-80B-A3B-Thinking adalah model foundation generasi berikutnya dari tim Qwen Alibaba, yang dirancang khusus untuk tugas-tugas penalaran kompleks. Ini dibangun di atas arsitektur Qwen3-Next yang inovatif, yang menggabungkan mekanisme Perhatian Hibrid (Gated DeltaNet dan Gated Attention) dengan struktur High-Sparsity Mixture-of-Experts (MoE) untuk mencapai efisiensi pelatihan dan Inferensi akhir. Sebagai model jarang dengan 80 miliar parameter, ini hanya mengaktifkan sekitar 3 miliar parameter selama Inferensi, secara signifikan mengurangi biaya komputasi dan memberikan throughput lebih dari 10 kali lipat lebih tinggi dibandingkan dengan model Qwen3-32B pada tugas konteks panjang yang melebihi 32K tokens. Versi 'Thinking' ini dioptimalkan untuk masalah multi-langkah yang menuntut seperti pembuktian matematika, sintesis kode, analisis logis, dan perencanaan agentik, dan ini mengOutput jejak 'thinking' terstruktur secara default. Dalam hal performa, ini melampaui model yang lebih mahal seperti Qwen3-32B-Thinking dan telah mengungguli Gemini-2.5-Flash-Thinking pada berbagai tolok ukur.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.14
/
$
0.57
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Tidak
Campuran Ahli
Ya
Total Parameter
80B
Parameter yang Diaktifkan
3B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
262K
Max Tokens
262K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
Tidak didukung
Output Terstruktur
Tidak didukung
Alat
didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

Qwen
chat
Qwen3-VL-32B-Instruct
Dirilis pada: 21 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
Dirilis pada: 21 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
Dirilis pada: 15 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
Dirilis pada: 15 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
Dirilis pada: 4 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
Dirilis pada: 4 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
Dirilis pada: 5 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
Dirilis pada: 11 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
Dirilis pada: 13 Agu 2025
$
0.29
/ Video
