Model-model

Produk

Harga

Dokumen

Blog

Tentang

Kontak

🎉 gemma-4-12B-it tersedia di SiliconFlow. Coba SEKARANG.

🎉 gemma-4-12B-it tersedia di SiliconFlow. Coba SEKARANG.

Model-model

Qwen3-30B-A3B-Instruct-2507

Qwen3-30B-A3B-Instruct-2507

Qwen/Qwen3-30B-A3B-Instruct-2507

Referensi API

Tentang Qwen3-30B-A3B-Instruct-2507

Qwen3-30B-A3B-Instruct-2507 adalah versi terbaru dari mode non-berpikir Qwen3-30B-A3B. Ini adalah model Mixture-of-Experts (MoE) dengan total 30,5 miliar parameter dan 3,3 miliar parameter yang diaktifkan. Versi ini menampilkan peningkatan kunci, termasuk peningkatan signifikan dalam kemampuan umum seperti mengikuti instruksi, penalaran logis, pemahaman text, matematika, sains, pengkodean, dan penggunaan alat. Ini juga menunjukkan peningkatan substansial dalam cakupan pengetahuan jangka panjang di berbagai bahasa dan menawarkan penyelarasan yang jauh lebih baik dengan preferensi pengguna dalam tugas subjektif dan terbuka, memungkinkan respons yang lebih bermanfaat dan generasi text berkualitas tinggi. Selain itu, kemampuannya dalam pemahaman konteks panjang telah ditingkatkan menjadi 256K. Model ini hanya mendukung mode non-berpikir dan tidak menghasilkan blok `<think></think>` dalam output-nya.

Tersedia Serverless

Jalankan kueri segera, bayar hanya untuk penggunaan

Per 1M Token (Input/Output)

$

0.09

/ M Tokens

Per 1M Token (Input/Output)

$

0.3

/ M Tokens

Playground

Penggunaan API

Tolok ukur

Kasus Penggunaan

Loading...

Metadata

Buat di

30 Jul 2025

Lisensi

APACHE-2.0

Penyedia

Qwen

HuggingFace

Qwen3-30B-A3B-Instruct-2507

Spesifikasi

Negara

Available

Arsitektur

Mixture of Experts

Terkalibrasi

Tidak

Campuran Ahli

Ya

Total Parameter

30B

Parameter yang Diaktifkan

3.3B

Penalaran

Tidak

Precision

FP8

Text panjang konteks

262K

Max Tokens

262K

Didukung Keberfungsian

Serverless

didukung

Serverless LoRA

Tidak didukung

Fine-tuning

Tidak didukung

Embeddings

Tidak didukung

Rerankers

Tidak didukung

Dukung Image Input

Tidak didukung

JSON Mode

didukung

Output Terstruktur

Tidak didukung

Alat

didukung

Fim Completion

Tidak didukung

Chat Prefix Completion

Tidak didukung

Bandingkan dengan Model Lain

Lihat bagaimana model ini dibandingkan dengan yang lain.

Qwen

chat

Qwen3-VL-32B-Instruct

Dirilis pada: 21 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

Dirilis pada: 21 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

Dirilis pada: 15 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

Dirilis pada: 15 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

Dirilis pada: 4 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

Dirilis pada: 4 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

Dirilis pada: 5 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

Dirilis pada: 11 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

Dirilis pada: 13 Agu 2025

$

0.29

/ Video

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·