モデル

製品

価格

ドキュメント

ブログ

約

連絡

🎉 gemma-4-31B-itはSiliconFlowで利用可能です。今すぐお試しください。

🎉 gemma-4-31B-itはSiliconFlowで利用可能です。今すぐお試しください。

モデル

Qwen3.5-122B-A10B

Qwen3.5-122B-A10B

Qwen/Qwen3.5-122B-A10B

APIリファレンス

約Qwen3.5-122B-A10B

Qwen3.5-122B-A10B is a native multimodal large language model from the Qwen team, with 122B total parameters and only 10B activated. It features an efficient hybrid architecture combining Gated Delta Networks with sparse Mixture-of-Experts (MoE), natively supporting a 256K context length extensible up to ~1M tokens. Through early fusion training, it achieves unified vision-language capabilities supporting text, image, and video understanding, with strong performance across knowledge, reasoning, coding, agents, visual understanding, and multilingual benchmarks, surpassing GPT-5-mini and Qwen3-235B-A22B on multiple metrics. It defaults to thinking mode, supports tool calling, and covers 201 languages and dialects

利用可能な Serverless

クエリをすぐに実行し、使用量のみを支払います

100万トークン（Input/Output）ごとに

$

0.26

/ M Tokens

100万トークン（Input/Output）ごとに

$

2.08

/ M Tokens

Playground

APIの使用

ベンチマーク

ユースケース

Loading...

メタデータ

作成する

2026/04/24

ライセンス

APACHE-2.0

プロバイダー

Qwen

ハギングフェイス

Qwen3.5-122B-A10B

仕様

州

Available

建築

Hybrid Sparse MoE

キャリブレートされた

はい

専門家の混合

はい

合計パラメータ

122B

アクティブ化されたパラメータ

10B

推論

いいえ

Precision

FP8

コンテキスト長

262K

Max Tokens

262K

対応機能

Serverless

対応

Serverless LoRA

サポートされていません

Fine-tuning

サポートされていません

Embeddings

サポートされていません

Rerankers

サポートされていません

Image入力をサポートする

対応

JSON Mode

対応

構造化されたOutputs

サポートされていません

ツール

対応

Fim Completion

サポートされていません

Chat Prefix Completion

サポートされていません

他のModelsと比較

他のモデルに対してこのModelがどのように比較されるかを見てください。

Qwen

chat

Qwen3.6-35B-A3B

リリース日：2026/04/17

Total Context:

262K

Max output:

262K

Input：

$

0.2

/ M Tokens

Output:

$

1.6

/ M Tokens

Qwen

chat

Qwen3.6-27B

リリース日：2026/04/23

Total Context:

262K

Max output:

262K

Input：

$

0.3

/ M Tokens

Output:

$

3.2

/ M Tokens

Qwen

chat

Qwen3.5-397B-A17B

リリース日：2026/04/24

Total Context:

262K

Max output:

262K

Input：

$

0.39

/ M Tokens

Output:

$

2.34

/ M Tokens

Qwen

chat

Qwen3.5-122B-A10B

リリース日：2026/04/24

Total Context:

262K

Max output:

262K

Input：

$

0.26

/ M Tokens

Output:

$

2.08

/ M Tokens

Qwen

chat

Qwen3.5-35B-A3B

リリース日：2026/02/25

Total Context:

262K

Max output:

262K

Input：

$

0.24

/ M Tokens

Output:

$

1.8

/ M Tokens

Qwen

chat

Qwen3.5-27B

リリース日：2026/04/24

Total Context:

262K

Max output:

262K

Input：

$

0.25

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3.5-9B

リリース日：2026/04/24

Total Context:

262K

Max output:

262K

Input：

$

0.1

/ M Tokens

Output:

$

0.15

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Instruct

リリース日：2025/10/21

Total Context:

262K

Max output:

262K

Input：

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

リリース日：2025/10/21

Total Context:

262K

Max output:

262K

Input：

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

AI開発を加速する準備はできていますか？

AI開発を加速する準備はできていますか？

AI開発を加速する準備はできていますか？

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー