約Qwen3-Reranker-4B
Qwen3-Reranker-4Bは、Qwen3シリーズの強力なテキストリランキングモデルであり、40億パラメータを備えています。これは、クエリに基づいてドキュメントの初期リストを再編成することで、検索結果の関連性を大幅に向上させるように設計されています。このモデルは、Qwen3の基盤のコアの強みを継承しており、32kのコンテキスト長までの長いテキストの優れた理解力や100以上の言語にわたる強力な能力を含んでいます。ベンチマークによると、Qwen3-Reranker-4Bモデルは、さまざまなテキストとコードの取得評価において優れたパフォーマンスを示しています。
Qwen3-Reranker-4Bが検索結果を知的に再配置することで、情報検索を向上させ、ユーザーがさまざまな言語や長いTextにおいて最も関連性の高いコンテンツを迅速に見つけることを保障します。
企業検索
内部文書検索の関連性を向上させ、従業員の生産性と情報探索を高めます。
ユースケース例:
""リモートワークガイドライン"のクエリに対し、100件の内部HRポリシー文書を再配置し、最も最新で関連性の高いポリシーを上位に置くことで従業員の検索時間を大幅に節約します。"
Eコマースの再ランキング
ユーザーのクエリと好みに基づいて商品のおすすめを再配置することにより、コンバージョン率を高めます。
ユースケース例:
""ゲーミングラップトップ"の検索に対し、50件の初期製品候補を再ランキングし、ハイエンドGPUと高評価を得ている製品を優先し、クリック率を15%向上させました。"
開発者リソース検索
コード検索や文書検索を向上させ、最も関連性の高いソリューションを迅速に浮かび上がらせます。
ユースケース例:
"特定のReactコンポーネント統合クエリに対して20件のJavaScriptコードスニペットを再ランキングし、最も効率的で最新の例を強調表示することで、開発時間を短縮しました。"
法的文書の関連性
ケース法、法令、契約を再配置し、最も適切な情報に優先順位を付けることで法的調査を迅速化します。
ユースケース例:
""データ漏洩に関するGDPRコンプライアンス"のクエリに対し30件の法的文書を再ランキングし、最も最近で直接適用可能な規則を上位に配置することで、法務担当者の審査の助けとなりました。"
メタデータ
仕様
州
Deprecated
建築
Dense Transformer
キャリブレートされた
はい
専門家の混合
いいえ
合計パラメータ
4B
アクティブ化されたパラメータ
4B
推論
いいえ
Precision
FP8
コンテキスト長
33K
Max Tokens
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。

Qwen
chat
Qwen3-VL-32B-Instruct
リリース日:2025/10/21
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
chat
Qwen3-VL-32B-Thinking
リリース日:2025/10/21
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Instruct
リリース日:2025/10/15
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
chat
Qwen3-VL-8B-Thinking
リリース日:2025/10/15
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Instruct
リリース日:2025/10/04
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
chat
Qwen3-VL-235B-A22B-Thinking
リリース日:2025/10/04
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Instruct
リリース日:2025/10/05
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
chat
Qwen3-VL-30B-A3B-Thinking
リリース日:2025/10/11
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1
/ M Tokens

Qwen
image-to-video
Wan2.2-I2V-A14B
リリース日:2025/08/13
$
0.29
/ Video
