Qwen3-Reranker-4B
Tentang Qwen3-Reranker-4B
Qwen3-Reranker-4B adalah model reranking Text yang kuat dari seri Qwen3, menampilkan 4 miliar parameter. Ini dirancang untuk secara signifikan meningkatkan relevansi hasil pencarian dengan mengatur ulang daftar awal dokumen berdasarkan kueri. Model ini mewarisi kekuatan inti dari fondasi Qwen3-nya, termasuk pemahaman luar biasa terhadap Text panjang (hingga konteks sepanjang 32 ribu) dan kemampuan tangguh di lebih dari 100 bahasa. Menurut tolok ukur, model Qwen3-Reranker-4B menunjukkan kinerja superior dalam berbagai evaluasi pengambilan Text dan kode.
Temukan bagaimana Qwen3-Reranker-4B meningkatkan pengambilan informasi dengan secara cerdas mengatur ulang hasil pencarian, memastikan pengguna menemukan konten paling relevan dengan cepat di berbagai bahasa dan Teks panjang.
Pencarian Perusahaan
Tingkatkan relevansi pencarian dokumen internal, meningkatkan produktivitas karyawan dan penemuan informasi.
Contoh Kasus Penggunaan:
"Mengatur ulang 100 dokumen kebijakan SDM internal untuk sebuah kueri pada "pedoman kerja jarak jauh," menempatkan kebijakan yang paling mutakhir dan relevan di atas, menghemat waktu pencarian karyawan secara signifikan."
Pengeseran E-commerce
Perbaiki rekomendasi produk dengan mengatur ulang item berdasarkan kueri dan preferensi pengguna, meningkatkan tingkat konversi.
Contoh Kasus Penggunaan:
"Untuk seorang pengguna yang mencari "laptop gaming," mengatur ulang 50 kecocokan produk awal untuk memprioritaskan yang memiliki GPU kelas atas dan ulasan positif, menghasilkan peningkatan 15% dalam rasio klik-tayang."
Pencarian Sumber Daya Pengembang
Tingkatkan pencarian kode dan penemuan dokumentasi untuk pengembang, dengan cepat menampilkan solusi yang paling relevan.
Contoh Kasus Penggunaan:
"Mengatur ulang 20 kemungkinan potongan kode JavaScript untuk kueri integrasi komponen React tertentu, menyoroti contoh yang paling efisien dan terbaru, mengurangi waktu pengembangan."
Relevansi Dokumen Hukum
Mempercepat penelitian hukum dengan mengatur ulang hukum kasus, undang-undang, atau kontrak untuk memprioritaskan informasi yang paling penting.
Contoh Kasus Penggunaan:
"Untuk kueri mengenai "kepatuhan GDPR untuk pelanggaran data," mengatur ulang 30 dokumen hukum, membawa peraturan yang paling baru dan langsung diterapkan ke atas, secara signifikan membantu penasihat hukum dalam tinjauan mereka."
Metadata
Spesifikasi
Negara
Deprecated
Arsitektur
Dense Transformer
Terkalibrasi
Ya
Campuran Ahli
Tidak
Total Parameter
4B
Parameter yang Diaktifkan
4B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
33K
Max Tokens
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

Qwen
chat
Qwen3-VL-32B-Instruct
Dirilis pada: 21 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
Dirilis pada: 21 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
Dirilis pada: 15 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
Dirilis pada: 15 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
Dirilis pada: 4 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
Dirilis pada: 4 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
Dirilis pada: 5 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
Dirilis pada: 11 Okt 2025
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
Dirilis pada: 13 Agu 2025
$
0.29
/ Video
