モデル

製品

価格

ドキュメント

ブログ

約

連絡

🎉 LongCat-2.0はSiliconFlowで利用可能です。今すぐお試しください。

🎉 LongCat-2.0はSiliconFlowで利用可能です。今すぐお試しください。

モデル

Qwen3-Reranker-4B

Qwen3-Reranker-4B

APIリファレンス

約Qwen3-Reranker-4B

Qwen3-Reranker-4Bは、Qwen3シリーズの強力なテキストリランキングモデルであり、40億パラメータを備えています。これは、クエリに基づいてドキュメントの初期リストを再編成することで、検索結果の関連性を大幅に向上させるように設計されています。このモデルは、Qwen3の基盤のコアの強みを継承しており、32kのコンテキスト長までの長いテキストの優れた理解力や100以上の言語にわたる強力な能力を含んでいます。ベンチマークによると、Qwen3-Reranker-4Bモデルは、さまざまなテキストとコードの取得評価において優れたパフォーマンスを示しています。

ユースケース

Qwen3-Reranker-4Bが検索結果を知的に再配置することで、情報検索を向上させ、ユーザーがさまざまな言語や長いTextにおいて最も関連性の高いコンテンツを迅速に見つけることを保障します。

企業検索

内部文書検索の関連性を向上させ、従業員の生産性と情報探索を高めます。

ユースケース例：

""リモートワークガイドライン"のクエリに対し、100件の内部HRポリシー文書を再配置し、最も最新で関連性の高いポリシーを上位に置くことで従業員の検索時間を大幅に節約します。"

Eコマースの再ランキング

ユーザーのクエリと好みに基づいて商品のおすすめを再配置することにより、コンバージョン率を高めます。

ユースケース例：

""ゲーミングラップトップ"の検索に対し、50件の初期製品候補を再ランキングし、ハイエンドGPUと高評価を得ている製品を優先し、クリック率を15％向上させました。"

開発者リソース検索

コード検索や文書検索を向上させ、最も関連性の高いソリューションを迅速に浮かび上がらせます。

ユースケース例：

"特定のReactコンポーネント統合クエリに対して20件のJavaScriptコードスニペットを再ランキングし、最も効率的で最新の例を強調表示することで、開発時間を短縮しました。"

法的文書の関連性

ケース法、法令、契約を再配置し、最も適切な情報に優先順位を付けることで法的調査を迅速化します。

ユースケース例：

""データ漏洩に関するGDPRコンプライアンス"のクエリに対し30件の法的文書を再ランキングし、最も最近で直接適用可能な規則を上位に配置することで、法務担当者の審査の助けとなりました。"

メタデータ

作成する

2025/06/06

ライセンス

APACHE-2.0

プロバイダー

Qwen

ハギングフェイス

Qwen3-Reranker-4B

仕様

州

Deprecated

建築

Dense Transformer

キャリブレートされた

はい

専門家の混合

いいえ

合計パラメータ

4B

アクティブ化されたパラメータ

4B

推論

いいえ

Precision

FP8

コンテキスト長

33K

Max Tokens

他のModelsと比較

他のモデルに対してこのModelがどのように比較されるかを見てください。

Qwen

chat

Qwen3-VL-32B-Instruct

リリース日：2025/10/21

Total Context:

262K

Max output:

262K

Input：

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

リリース日：2025/10/21

Total Context:

262K

Max output:

262K

Input：

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

リリース日：2025/10/15

Total Context:

262K

Max output:

262K

Input：

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

リリース日：2025/10/15

Total Context:

262K

Max output:

262K

Input：

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

リリース日：2025/10/04

Total Context:

262K

Max output:

262K

Input：

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

リリース日：2025/10/04

Total Context:

262K

Max output:

262K

Input：

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

リリース日：2025/10/05

Total Context:

262K

Max output:

262K

Input：

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

リリース日：2025/10/11

Total Context:

262K

Max output:

262K

Input：

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

リリース日：2025/08/13

$

0.29

/ Video

AI開発を加速する準備はできていますか？

AI開発を加速する準備はできていますか？

AI開発を加速する準備はできていますか？

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー

ページ

ドキュメント

モデル

製品

予約されたGPU

© 2025 SiliconFlow

·

プライバシー