モデル

製品

価格

ドキュメント

ブログ

約

連絡

🎉 LongCat-2.0はSiliconFlowで利用可能です。今すぐお試しください。

🎉 LongCat-2.0はSiliconFlowで利用可能です。今すぐお試しください。

モデル

Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct

APIリファレンス

約Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instructは、AlibabaのQwenチームによってリリースされた次世代のファウンデーションModelです。新しいQwen3-Nextアーキテクチャに基づいて構築されており、究極のトレーニングとInferenceの効率性を追求しています。このModelには、ハイブリッド・アテンション・メカニズム（ゲーティッド・デルタネットとゲーティッド・アテンション）、高スパース性のMixture-of-Experts（MoE）構造、およびさまざまな安定性の最適化などの革新的な機能が組み込まれています。80億パラメータのスパースModelとして、Inference中に1tokenあたり約30億のパラメータのみがアクティブ化され、計算コストを大幅に削減し、32K tokensを超える長いコンテキストタスクのためにQwen3-32B Modelと比べて10倍以上のスループットを提供します。これは汎用タスク向けに最適化された指示調整版であり、「思考モード」はサポートしていません。パフォーマンス面では、いくつかのベンチマークでQwenのフラッグシップModelであるQwen3-235Bに匹敵し、超長コンテキストシナリオで顕著な利点を示しています。

ユースケース

Qwen3-Next-80B-A3B-Instructの超ロングコンテキストと効率的な推論が、複雑で大規模な問題をどのように解決するかを探索します。

超ロングドキュメント合成

法的文書、研究論文、または歴史的アーカイブのような巨大な文書から洞察を処理し、合成するために、1M tokenコンテキストを活用します。

ユースケース例:

"法務チームがそれを使用して5000ページの発見文書を分析し、重要な議論を抽出し、関連する判例法を数分で特定します。"

大規模コードベース分析

建築パターン、依存関係、リファクタリングの機会を特定することにより、広大なコードベースを把握し最適化します。

ユースケース例:

"工学会社がレガシーPythonアプリケーションをリファクタリングするためにそれを使用し、モジュールの相互作用をマッピングし、重要なデータパイプラインのためのパフォーマンス向上を提案します。"

高度な金融市場情報

大規模なリアルタイムおよび歴史的な金融データ、ニュース、および経済レポートを分析して、市場のトレンドを予測し、複雑な取引戦略を策定します。

ユースケース例:

"金融アナリストがモデルを使用して、10年間の世界市場データとニュース記事を処理し、新しいアルゴリズム取引戦略のための微妙な相関を特定します。"

包括的な規制遵守

操作データに対して複雑な規制フレームワークおよび内部ポリシーの監査を自動化し、コンプライアンスを保証し、リスクを特定します。

ユースケース例:

"医療提供者がHIPAA規制と患者データ処理を照合し、潜在的なプライバシー違反を指摘し、ポリシー更新を提案するためにそれを活用します。"

科学的発見加速

膨大な科学文献および実験データを分析して、仮説を生成し、実験を設計し、結果を検証することで研究を加速します。

ユースケース例:

"材料科学研究者がそれを使って数千のジャーナル記事と実験結果を精査し、所望の特性を持つ新しい合金組成を提案します。"

メタデータ

作成する

2025/09/18

ライセンス

APACHE-2.0

プロバイダー

Qwen

ハギングフェイス

Qwen3-Next-80B-A3B-Instruct

仕様

州

Deprecated

建築

Hybrid Attention MoE

キャリブレートされた

いいえ

専門家の混合

はい

合計パラメータ

80B

アクティブ化されたパラメータ

3B

推論

いいえ

Precision

FP8

コンテキスト長

262K

Max Tokens

262K

他のModelsと比較

他のモデルに対してこのModelがどのように比較されるかを見てください。

Qwen

chat

Qwen3-VL-32B-Instruct

リリース日：2025/10/21

Total Context:

262K

Max output:

262K

Input：

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

リリース日：2025/10/21

Total Context:

262K

Max output:

262K

Input：

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

リリース日：2025/10/15

Total Context:

262K

Max output:

262K

Input：

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

リリース日：2025/10/15

Total Context:

262K

Max output:

262K

Input：

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

リリース日：2025/10/04

Total Context:

262K

Max output:

262K

Input：

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

リリース日：2025/10/04

Total Context:

262K

Max output:

262K

Input：

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

リリース日：2025/10/05

Total Context:

262K

Max output:

262K

Input：

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

リリース日：2025/10/11

Total Context:

262K

Max output:

262K

Input：

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

リリース日：2025/08/13

$

0.29

/ Video

AI開発を加速する準備はできていますか？

AI開発を加速する準備はできていますか？

AI開発を加速する準備はできていますか？

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー