Qwen3-Embedding-4B
Tentang Qwen3-Embedding-4B
Qwen3-Embedding-4B adalah model kepemilikan terbaru dalam seri Qwen3 Embedding, yang dirancang khusus untuk tugas embedding teks dan peringkat. Dibangun di atas model dasar yang padat dari seri Qwen3, model parameter 4B ini mendukung panjang konteks hingga 32K dan dapat menghasilkan embedding dengan dimensi hingga 2560. Model ini mewarisi kemampuan multibahasa yang luar biasa yang mendukung lebih dari 100 bahasa, serta pemahaman teks panjang dan keterampilan penalaran. Model ini mencapai kinerja yang sangat baik pada papan peringkat multibahasa MTEB (skor 69,45) dan menunjukkan hasil luar biasa di berbagai tugas termasuk pengambilan kembali teks, pengambilan kembali kode, klasifikasi teks, pengelompokan, dan penambangan bitext. Model ini menawarkan dimensi vektor yang fleksibel (32 hingga 2560) dan kemampuan sadar instruksi untuk peningkatan kinerja dalam tugas dan skenario tertentu, memberikan keseimbangan optimal antara efisiensi dan efektivitas
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.02
Per 1M Token
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Tidak
Campuran Ahli
Tidak
Total Parameter
4B
Parameter yang Diaktifkan
4B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
33K
Max Tokens
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
Tidak didukung
Output Terstruktur
Tidak didukung
Alat
Tidak didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
Tidak didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

Qwen
chat
Qwen3-VL-32B-Instruct
Dirilis pada: 21 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
Dirilis pada: 21 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
Dirilis pada: 15 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
Dirilis pada: 15 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
Dirilis pada: 4 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
Dirilis pada: 4 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
Dirilis pada: 5 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
Dirilis pada: 11 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
Dirilis pada: 13 Agu 2025
$
0.29
/ Video
