모델

제품

가격

문서

블로그

에 대하여

연락하다

🎉 LongCat-2.0 는 SiliconFlow에서 가능합니다. 지금 시도해 보세요.

🎉 LongCat-2.0 는 SiliconFlow에서 가능합니다. 지금 시도해 보세요.

모델

Qwen3-Reranker-4B

Qwen3-Reranker-4B

API 참조

정보에 대해서Qwen3-Reranker-4B

Qwen3-Reranker-4B는 Qwen3 시리즈의 강력한 Text 재정렬 Model로, 40억 개의 매개변수를 특징으로 합니다. 이는 처음 문서 목록을 쿼리에 기반하여 재정렬함으로써 검색 결과의 관련성을 크게 향상시키도록 설계되었습니다. 이 Model은 32k 컨텍스트 길이까지의 장문에 대한 뛰어난 이해와 100개 이상의 언어에 걸친 강력한 기능 등을 포함한 Qwen3 기반의 핵심 강점을 계승하고 있습니다. 벤치마크에 따르면, Qwen3-Reranker-4B Model은 다양한 Text 및 코드 검색 평가에서 우수한 성능을 보여줍니다.

사용 사례

Qwen3-Reranker-4B가 정보 검색을 향상시켜 검색 결과를 지능적으로 재정렬하여, 사용자가 다양한 언어와 긴 Text에서 가장 관련성이 높은 콘텐츠를 빠르게 찾을 수 있도록 보장하는 방법을 발견하십시오.

기업 검색

내부 문서 검색 관련성을 향상시켜 직원의 생산성과 정보 발견을 증대시킵니다.

사용 사례 예시:

""원격 근무 지침"에 대한 쿼리를 위해 100개의 내부 HR 정책 문서를 재정렬하여 가장 최신이고 관련성 높은 정책을 상단에 배치하여, 직원들의 검색 시간을 상당히 절약했습니다."

전자 상거래 재순위 조정

사용자 쿼리와 선호도에 기반하여 항목을 재정렬함으로써 제품 추천을 개선하고 전환율을 증가시킵니다.

사용 사례 예시:

""게임용 노트북"을 검색하는 사용자에게 초기 50개 제품 일치를 재정렬하여 고급 GPU와 긍정적인 리뷰가 있는 제품을 우선시하여 클릭률을 15% 증가시켰습니다."

개발자 리소스 검색

코드 검색과 문서 발견을 개선하여 개발자가 가장 관련성 높은 솔루션을 빠르게 찾을 수 있도록 합니다.

사용 사례 예시:

"특정 React 컴포넌트 통합 쿼리를 위해 20개의 잠재적인 JavaScript 코드 스니펫을 재정렬하여 가장 효율적이고 최신의 예시를 강조하여 개발 시간을 단축시켰습니다."

법률 문서 관련성

사례법, 법령 또는 계약서를 재정렬하여 가장 중요한 정보를 우선시함으로써 법률 연구를 가속화합니다.

사용 사례 예시:

""GDPR 위반 시 데이터 침해에 대한 규정 준수"에 대한 쿼리를 위해 30개의 법률 문서를 재정렬하여 가장 최근의 직접적이고 적용 가능한 규정을 상단에 배치하여, 법률 자문에게 그들의 검토에 크게 기여했습니다."

메타데이터

생성하다

2025. 6. 6.

라이센스

APACHE-2.0

공급자

Qwen

허깅페이스

Qwen3-Reranker-4B

사양

주

Deprecated

건축

Dense Transformer

교정된

네

전문가의 혼합

아니요

총 매개변수

4B

활성화된 매개변수

4B

추론

아니요

Precision

FP8

콘텍스트 길이

33K

Max Tokens

다른 모델과 비교

이 Model이 다른 것들과 어떻게 비교되는지 보세요.

Qwen

chat

Qwen3-VL-32B-Instruct

출시일: 2025. 10. 21.

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

출시일: 2025. 10. 21.

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

출시일: 2025. 10. 15.

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

출시일: 2025. 10. 15.

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

출시일: 2025. 10. 4.

Total Context:

262K

Max output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

출시일: 2025. 10. 4.

Total Context:

262K

Max output:

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

출시일: 2025. 10. 5.

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

출시일: 2025. 10. 11.

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

출시일: 2025. 8. 13.

$

0.29

/ Video

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

페이지

모델

제품

© 2025 SiliconFlow

·

개인정보 보호

페이지

모델

제품

© 2025 SiliconFlow

·

개인정보 보호

페이지

모델

제품

© 2025 SiliconFlow

·

개인정보 보호