Model-model

Produk

Harga

Dokumen

Blog

Tentang

Kontak

🎉 gemma-4-31B-it tersedia di SiliconFlow. Coba SEKARANG.

🎉 gemma-4-31B-it tersedia di SiliconFlow. Coba SEKARANG.

Model-model

Qwen3.5-122B-A10B

Qwen3.5-122B-A10B

Qwen/Qwen3.5-122B-A10B

Referensi API

Tentang Qwen3.5-122B-A10B

Qwen3.5-122B-A10B is a native multimodal large language model from the Qwen team, with 122B total parameters and only 10B activated. It features an efficient hybrid architecture combining Gated Delta Networks with sparse Mixture-of-Experts (MoE), natively supporting a 256K context length extensible up to ~1M tokens. Through early fusion training, it achieves unified vision-language capabilities supporting text, image, and video understanding, with strong performance across knowledge, reasoning, coding, agents, visual understanding, and multilingual benchmarks, surpassing GPT-5-mini and Qwen3-235B-A22B on multiple metrics. It defaults to thinking mode, supports tool calling, and covers 201 languages and dialects

Tersedia Serverless

Jalankan kueri segera, bayar hanya untuk penggunaan

Per 1M Token (Input/Output)

$

0.26

/ M Tokens

Per 1M Token (Input/Output)

$

2.08

/ M Tokens

Playground

Penggunaan API

Tolok ukur

Kasus Penggunaan

Loading...

Metadata

Buat di

24 Apr 2026

Lisensi

APACHE-2.0

Penyedia

Qwen

HuggingFace

Qwen3.5-122B-A10B

Spesifikasi

Negara

Available

Arsitektur

Hybrid Sparse MoE

Terkalibrasi

Ya

Campuran Ahli

Ya

Total Parameter

122B

Parameter yang Diaktifkan

10B

Penalaran

Tidak

Precision

FP8

Text panjang konteks

262K

Max Tokens

262K

Didukung Keberfungsian

Serverless

didukung

Serverless LoRA

Tidak didukung

Fine-tuning

Tidak didukung

Embeddings

Tidak didukung

Rerankers

Tidak didukung

Dukung Image Input

didukung

JSON Mode

didukung

Output Terstruktur

Tidak didukung

Alat

didukung

Fim Completion

Tidak didukung

Chat Prefix Completion

Tidak didukung

Bandingkan dengan Model Lain

Lihat bagaimana model ini dibandingkan dengan yang lain.

Qwen

chat

Qwen3.6-35B-A3B

Dirilis pada: 17 Apr 2026

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.6

/ M Tokens

Qwen

chat

Qwen3.6-27B

Dirilis pada: 23 Apr 2026

Total Context:

262K

Max output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

3.2

/ M Tokens

Qwen

chat

Qwen3.5-397B-A17B

Dirilis pada: 24 Apr 2026

Total Context:

262K

Max output:

262K

Input:

$

0.39

/ M Tokens

Output:

$

2.34

/ M Tokens

Qwen

chat

Qwen3.5-122B-A10B

Dirilis pada: 24 Apr 2026

Total Context:

262K

Max output:

262K

Input:

$

0.26

/ M Tokens

Output:

$

2.08

/ M Tokens

Qwen

chat

Qwen3.5-35B-A3B

Dirilis pada: 25 Feb 2026

Total Context:

262K

Max output:

262K

Input:

$

0.24

/ M Tokens

Output:

$

1.8

/ M Tokens

Qwen

chat

Qwen3.5-27B

Dirilis pada: 24 Apr 2026

Total Context:

262K

Max output:

262K

Input:

$

0.25

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3.5-9B

Dirilis pada: 24 Apr 2026

Total Context:

262K

Max output:

262K

Input:

$

0.1

/ M Tokens

Output:

$

0.15

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Instruct

Dirilis pada: 21 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

Dirilis pada: 21 Okt 2025

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·