deepseek-vl2
Tentang deepseek-vl2
DeepSeek-VL2 adalah model vision-language dengan tenaga ahli campuran (MoE) yang dikembangkan berdasarkan DeepSeekMoE-27B, menggunakan arsitektur MoE yang diaktifkan secara jarang untuk mencapai kinerja superior dengan hanya 4.5B parameter aktif. Model ini unggul dalam berbagai tugas termasuk menjawab pertanyaan visual, pengenalan karakter optik, pemahaman dokumen/tabel/chart, dan penempatan visual. Dibandingkan dengan model dense open-source yang ada dan model berbasis MoE, ia menunjukkan kinerja yang kompetitif atau paling unggul dengan menggunakan parameter aktif yang sama atau lebih sedikit.
Jelajahi bagaimana kemampuan bahasa Vision canggih DeepSeek-VL2 memecahkan masalah kompleks di dunia nyata di berbagai industri.
Pemrosesan Dokumen Cerdas
Otomatisasi ekstraksi dan analisis data dari dokumen beragam seperti faktur, kontrak, dan laporan, memanfaatkan OCR dan pemahaman visual.
Contoh Kasus Penggunaan:
"Secara otomatis mengekstraksi angka kunci dari laporan keuangan yang dipindai dan mengisi database, mengurangi entri data manual sebesar 80% untuk firma akuntansi."
Analisis Konten Visual
Mengidentifikasi dan mengkategorikan objek, adegan, atau konten yang tidak pantas dalam Image dan Video untuk moderasi, pencarian, atau analitik.
Contoh Kasus Penggunaan:
"Menandai item yang dilarang atau konten sensitif dalam gambar produk e-commerce yang diunggah pengguna, memastikan kepatuhan dengan pedoman platform dan keamanan merek."
Penulisan Keterangan Image Otomatis
Menghasilkan deskripsi yang rinci dan sesuai konteks untuk Image, meningkatkan aksesibilitas bagi pengguna tunanetra dan meningkatkan SEO konten.
Contoh Kasus Penggunaan:
"Menyediakan deskripsi teks yang kaya untuk pemindaian MRI medis yang kompleks, menjelaskan temuan kepada dokter atau pasien, atau menghasilkan teks alt untuk gambar web."
Peningkatan Produk E-commerce
Secara otomatis memberi tag pada Image produk dengan atribut, merek, dan kategori untuk meningkatkan pencarian, rekomendasi, dan pengelolaan inventaris.
Contoh Kasus Penggunaan:
"Menganalisis Image item pakaian untuk mengidentifikasi gaya, warna, bahan, dan merek dari logo, mengisi metadata produk untuk sistem katalog online."
Metadata
Spesifikasi
Negara
Deprecated
Arsitektur
Terkalibrasi
Tidak
Campuran Ahli
Ya
Total Parameter
27B
Parameter yang Diaktifkan
4.5B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
4K
Max Tokens
4K
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.
DeepSeek
chat
DeepSeek-V3.2
Dirilis pada: 4 Des 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
Dirilis pada: 10 Okt 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
Dirilis pada: 29 Sep 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
Dirilis pada: 25 Agu 2025
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-V3
Dirilis pada: 26 Des 2024
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1
/ M Tokens
DeepSeek
chat
DeepSeek-R1
Dirilis pada: 28 Mei 2025
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
Dirilis pada: 20 Jan 2025
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
Dirilis pada: 20 Jan 2025
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
