Model-model

Produk

Harga

Dokumen

Blog

Tentang

Kontak

🎉 Kimi-K2.5 tersedia di SiliconFlow. Coba SEKARANG.

🎉 Kimi-K2.5 tersedia di SiliconFlow. Coba SEKARANG.

Model-model

QwQ-32B

QwQ-32B

Qwen/QwQ-32B

Referensi API

Tentang QwQ-32B

QwQ adalah model penalaran dari seri Qwen. Dibandingkan dengan model yang disesuaikan dengan instruksi konvensional, QwQ, yang mampu berpikir dan bernalar, dapat mencapai kinerja yang ditingkatkan secara signifikan dalam tugas hilir, terutama masalah yang sulit. QwQ-32B adalah model penalaran berukuran menengah, yang mampu mencapai kinerja kompetitif terhadap Model penalaran mutakhir, misalnya, DeepSeek-R1, o1-mini. Model ini menggabungkan teknologi seperti RoPE, SwiGLU, RMSNorm, dan bias Perhatian QKV, dengan 64 lapisan dan 40 kepala perhatian Q (8 untuk KV dalam arsitektur GQA)

Tersedia Serverless

Jalankan kueri segera, bayar hanya untuk penggunaan

$

0.15

/

$

0.58

Per 1M Token (Input/Output)

Playground

Penggunaan API

Tolok ukur

Kasus Penggunaan

Loading...

Metadata

Buat di

6 Mar 2025

Lisensi

APACHE-2.0

Penyedia

Qwen

HuggingFace

Spesifikasi

Negara

Available

Arsitektur

Terkalibrasi

Tidak

Campuran Ahli

Tidak

Total Parameter

32B

Parameter yang Diaktifkan

32.5B

Penalaran

Tidak

Precision

FP8

Text panjang konteks

131K

Max Tokens

131K

Didukung Keberfungsian

Serverless

didukung

Serverless LoRA

Tidak didukung

Fine-tuning

Tidak didukung

Embeddings

Tidak didukung

Rerankers

Tidak didukung

Dukung Image Input

Tidak didukung

JSON Mode

Tidak didukung

Output Terstruktur

Tidak didukung

Alat

didukung

Fim Completion

Tidak didukung

Chat Prefix Completion

Tidak didukung

Bandingkan dengan Model Lain

Lihat bagaimana model ini dibandingkan dengan yang lain.

Qwen

chat

Qwen3-VL-32B-Instruct

Dirilis pada: 21 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

Dirilis pada: 21 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

Dirilis pada: 15 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

Dirilis pada: 15 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

Dirilis pada: 4 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

Dirilis pada: 4 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

Dirilis pada: 5 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

Dirilis pada: 11 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

Dirilis pada: 13 Agu 2025

$

0.29

/ Video

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

Select Language

Indonesian (Indonesia)

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

Select Language

Indonesian (Indonesia)

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

Select Language

Indonesian (Indonesia)

© 2025 SiliconFlow

·