Model-model

Produk

Harga

Dokumen

Blog

Tentang

Kontak

🎉 gemma-4-12B-it tersedia di SiliconFlow. Coba SEKARANG.

🎉 gemma-4-12B-it tersedia di SiliconFlow. Coba SEKARANG.

Model-model

Qwen3-Embedding-8B

Qwen3-Embedding-8B

Qwen/Qwen3-Embedding-8B

Referensi API

Tentang Qwen3-Embedding-8B

Qwen3-Embedding-8B adalah model kepemilikan terbaru dalam seri Qwen3 Embedding, dirancang khusus untuk tugas penanaman dan perankingan Text. Dibangun di atas model dasar padat dari seri Qwen3, model 8B parameter ini mendukung panjang konteks hingga 32K dan dapat menghasilkan embedding dengan dimensi hingga 4096. Model ini mewarisi kemampuan multibahasa yang luar biasa yang mendukung lebih dari 100 bahasa, bersama dengan pemahaman dan keterampilan penalaran teks panjang. Model ini menempati peringkat No.1 di papan peringkat multibahasa MTEB (per 5 Juni 2025, skor 70.58) dan menunjukkan kinerja mutakhir dalam berbagai tugas termasuk pengambilan Text, pengambilan kode, klasifikasi Text, clustering, dan penambangan bitext. Model ini menawarkan dimensi vektor yang fleksibel (32 hingga 4096) dan kemampuan sadar instruksi untuk peningkatan kinerja dalam tugas dan skenario tertentu.

Tersedia Serverless

Jalankan kueri segera, bayar hanya untuk penggunaan

Per 1M Token (Input/Output)

$

0.04

/ M Tokens

Playground

Penggunaan API

Tolok ukur

Kasus Penggunaan

Loading...

Metadata

Buat di

6 Jun 2025

Lisensi

APACHE-2.0

Penyedia

Qwen

HuggingFace

Qwen3-Embedding-8B

Spesifikasi

Negara

Available

Arsitektur

Dense Transformer

Terkalibrasi

Tidak

Campuran Ahli

Tidak

Total Parameter

8B

Parameter yang Diaktifkan

8B

Penalaran

Tidak

Precision

FP8

Text panjang konteks

33K

Max Tokens

Didukung Keberfungsian

Serverless

didukung

Serverless LoRA

Tidak didukung

Fine-tuning

Tidak didukung

Embeddings

didukung

Rerankers

Tidak didukung

Dukung Image Input

Tidak didukung

JSON Mode

Tidak didukung

Output Terstruktur

Tidak didukung

Alat

Tidak didukung

Fim Completion

Tidak didukung

Chat Prefix Completion

Tidak didukung

Bandingkan dengan Model Lain

Lihat bagaimana model ini dibandingkan dengan yang lain.

Qwen

chat

Qwen3-VL-32B-Instruct

Dirilis pada: 21 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

Dirilis pada: 21 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

Dirilis pada: 15 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

Dirilis pada: 15 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

Dirilis pada: 4 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

Dirilis pada: 4 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

Dirilis pada: 5 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

Dirilis pada: 11 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

Dirilis pada: 13 Agu 2025

$

0.29

/ Video

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·