
Qwen
Text Generation
Qwen3-VL-32B-Instruct
출시일: 2025. 10. 21.
Qwen3-VL은 Qwen3 시리즈의 vision-language Model로, 다양한 vision-language(VL) 벤치마크에서 state-of-the-art(SOTA) 성능을 달성하고 있습니다. 이 Model은 최대 메가픽셀 수준의 고해상도 Image Input을 지원하며, 일반적인 시각적 이해, 다국어 OCR, 세밀한 시각적 기준 설정 및 시각적 대화에서 강력한 기능을 가지고 있습니다. Qwen3 시리즈의 일환으로서, 이는 강력한 언어 기반을 물려받아 복잡한 지시를 이해하고 실행할 수 있습니다....
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
Text Generation
Qwen3-VL-32B-Thinking
출시일: 2025. 10. 21.
Qwen3-VL-Thinking은 복잡한 시각적 추론 작업에 특별히 최적화된 Qwen3-VL 시리즈의 한 버전입니다. '생각 모드'를 통합하여 최종 답변을 제공하기 전에 상세한 중간 추론 단계(Chain-of-Thought)를 생성할 수 있습니다. 이 설계는 시각 질문 응답(VQA) 및 다단계 논리, 계획 및 심층 분석이 필요한 기타 Vision-언어 작업에서 Model의 성능을 크게 향상시킵니다....
Total Context:
262K
Max output:
262K
Input:
$
0.2
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
Text Generation
Qwen3-VL-8B-Instruct
출시일: 2025. 10. 15.
Qwen3-VL-8B-Instruct는 Qwen3 시리즈의 Vision-언어 Model로서, 일반적인 시각 이해, 시각 중심 대화 및 이미지 내 다국어 Text 인식에서 강력한 능력을 보여줍니다....
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
0.68
/ M Tokens

Qwen
Text Generation
Qwen3-VL-8B-Thinking
출시일: 2025. 10. 15.
Qwen3-VL-8B-Thinking은 Qwen3 시리즈의 Vision-Language Model로, 복잡한 추론이 필요한 시나리오에 최적화되어 있습니다. 이 Thinking 모드에서 모델은 최종 답변을 제공하기 전에 단계별 사고와 추론을 수행합니다....
Total Context:
262K
Max output:
262K
Input:
$
0.18
/ M Tokens
Output:
$
2.0
/ M Tokens

Qwen
Text Generation
Qwen3-VL-235B-A22B-Instruct
출시일: 2025. 10. 4.
Qwen3-VL-235B-A22B-Instruct는 235B 매개변수의 전문가 혼합(MoE) 비전-언어 모델로, 22B 활성화된 매개변수를 가지고 있습니다. 이는 Qwen3-VL-235B-A22B의 지침 조정 버전이며, Chat 애플리케이션에 맞춰 조정되었습니다....
Total Context:
262K
Max output:
262K
Input:
$
0.3
/ M Tokens
Output:
$
1.5
/ M Tokens

Qwen
Text Generation
Qwen3-VL-235B-A22B-Thinking
출시일: 2025. 10. 4.
Qwen3-VL-235B-A22B-Thinking은 Qwen3-VL 시리즈 모델 중 하나로, 추론이 강화된 Thinking 에디션입니다. 이 모델은 STEM, 수학, 인과 분석, 논리적이고 증거 기반의 답변을 포함하여 많은 멀티모달(Multimodal) 추론 벤치마크에서 최첨단(SOTA) 결과를 달성합니다. 235B의 총 매개 변수와 22B의 활성 매개 변수를 갖춘 전문가 혼합(Mixture-of-Experts, MoE) 아키텍처를 특징으로 합니다....
Total Context:
262K
Max output:
262K
Input:
$
0.45
/ M Tokens
Output:
$
3.5
/ M Tokens

Qwen
Text Generation
Qwen3-VL-30B-A3B-Instruct
출시일: 2025. 10. 5.
Qwen3-VL 시리즈는 우수한 Text 이해 및 생성, 더 깊은 시각적 인식 및 추론, 확장된 문맥 길이, 향상된 공간 및 Video 역학 이해, 더 강력한 에이전트 상호작용 능력을 제공합니다. 엣지에서 클라우드로 확장되는 Dense 및 MoE 아키텍처에서 사용할 수 있으며, Instruct 및 추론 강화 Thinking 에디션으로 제공됩니다....
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
Text Generation
Qwen3-VL-30B-A3B-Thinking
출시일: 2025. 10. 11.
Qwen3-VL 시리즈는 우수한 Text 이해 및 생성, 더 깊은 시각적 인식 및 추론, 확장된 문맥 길이, 향상된 공간 및 Video 역학 이해, 더 강력한 에이전트 상호작용 능력을 제공합니다. 엣지에서 클라우드로 확장되는 Dense 및 MoE 아키텍처에서 사용할 수 있으며, Instruct 및 추론 강화 Thinking 에디션으로 제공됩니다....
Total Context:
262K
Max output:
262K
Input:
$
0.29
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
Image-to-Video
Wan2.2-I2V-A14B
출시일: 2025. 8. 13.
$
0.29
/ Video


Qwen
Text-to-Video
Wan2.2-T2V-A14B
출시일: 2025. 8. 13.
$
0.29
/ Video


Qwen
Text Generation
Qwen3-Next-80B-A3B-Instruct
출시일: 2025. 9. 18.
Qwen3-Next-80B-A3B-Instruct는 Alibaba의 Qwen 팀이 출시한 차세대 기초 Model입니다. 이는 궁극의 훈련 및 Inference 효율성을 위해 설계된 새로운 Qwen3-Next 아키텍처를 기반으로 구축되었습니다. 이 Model은 하이브리드 어텐션 메커니즘(게이트 델타넷과 게이트 어텐션), 고희소 혼합 전문가(MoE) 구조 및 다양한 안정성 최적화와 같은 혁신적인 기능을 통합하고 있습니다. 800억 개의 매개변수를 가진 희소 Model로서, Inference 과정에서 token당 약 30억 개의 매개변수만 활성화되어 계산 비용을 크게 절감하고 32K tokens를 초과하는 장문 작업에서 Qwen3-32B Model보다 10배 이상의 처리량을 제공합니다. 이는 범용 작업에 최적화된 인스트럭션 튜닝 버전이며 '사고' 모드를 지원하지 않습니다. 성능 측면에서 일부 벤치마크에서 Qwen의 플래그십 Model인 Qwen3-235B와 비교할 수 있으며, 초장문 시나리오에서 상당한 장점을 보여줍니다....
Total Context:
262K
Max output:
262K
Input:
$
0.14
/ M Tokens
Output:
$
1.4
/ M Tokens

Qwen
Text Generation
Qwen3-Next-80B-A3B-Thinking
출시일: 2025. 9. 25.
Qwen3-Next-80B-A3B-Thinking은 Alibaba의 Qwen 팀에서 복잡한 추론 작업을 위해 특별히 설계된 차세대 기초 Model입니다. 이는 Gated DeltaNet과 Gated Attention을 결합한 Hybrid Attention 메커니즘과 고스파시티 혼합 전문가(MoE) 구조를 사용하여 궁극적인 훈련 및 Inference 효율성을 달성합니다. 800억 개의 매개변수를 가진 Sparse Model로, Inference 도중 약 30억 개의 매개변수만 활성화하여 계산 비용을 크게 줄이고, 32K token을 초과하는 장기 컨텍스트 작업에서 Qwen3-32B 모델보다 10배 이상의 처리량을 제공합니다. 이 'Thinking' 버전은 수학적 증명, 코드 합성, 논리적 분석, 계획과 같은 까다로운 다단계 문제에 최적화되어 있으며, 기본적으로 구조화된 'thinking' 트레이스를 Output 합니다. 성능 면에서, 더 높은 비용의 모델인 Qwen3-32B-Thinking을 능가했으며 여러 벤치마크에서 Gemini-2.5-Flash-Thinking을 능가했습니다....
Total Context:
262K
Max output:
262K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

Qwen
Text Generation
Qwen3-Omni-30B-A3B-Captioner
출시일: 2025. 10. 4.
Qwen3-Omni-30B-A3B-Captioner는 Alibaba의 Qwen 팀에서 Qwen3 시리즈의 일환으로 개발한 Vision-언어 Model (VLM)입니다. 이는 고품질, 상세하고 정확한 이미지 캡션 생성을 위해 특별히 설계되었습니다. 30B 총 파라미터 전문가 혼합(MoE) 아키텍처 기반의 이 모델은 이미지 내용을 깊이 이해하고 그것을 풍부하고 자연스러운 언어 Text로 번역할 수 있습니다....
Total Context:
66K
Max output:
66K
Input:
$
0.1
/ M Tokens
Output:
$
0.4
/ M Tokens

Qwen
Text Generation
Qwen3-Omni-30B-A3B-Instruct
출시일: 2025. 10. 4.
Qwen3-Omni-30B-A3B-Instruct는 Alibaba의 Qwen 팀이 제공하는 최신 Qwen3 시리즈의 일원입니다. 이는 300억 개의 총 매개변수와 30억 개의 활성 매개변수를 가진 전문화된 전문가 집합(MoE) Model로, 뛰어난 성능을 유지하면서도 Inference 비용을 효과적으로 줄입니다. 이 Model은 고품질, 다중 출처, 다국어 데이터로 학습되어 다국어 대화와 같은 기본 기능뿐만 아니라 코드, 수학에서도 뛰어난 성능을 보여줍니다....
Total Context:
66K
Max output:
66K
Input:
$
0.1
/ M Tokens
Output:
$
0.4
/ M Tokens

Qwen
Text Generation
Qwen3-Omni-30B-A3B-Thinking
출시일: 2025. 10. 4.
Qwen3-Omni-30B-A3B-Thinking은 Qwen3-Omni 전체 모달 모델의 "Thinker-Talker" 아키텍처 내의 핵심 "Thinker" 구성 요소입니다. 이 구성 요소는 text, audio, images, video를 포함한 다중모달 inputs를 처리하고 복잡한 연쇄 사고 추론을 실행하도록 특별히 설계되었습니다. 이 시스템의 추론 두뇌로서, 이 model은 모든 입력을 공통적인 표현 공간으로 통합하여 이해와 분석을 가능하게 하지만, output은 text 전용입니다. 이 설계는 이미지로 제시된 수학적 문제와 같이 깊은 사고와 교차 모달 이해가 필요한 복잡한 문제를 해결하는 데 뛰어나기 때문에, 전체 Qwen3-Omni 아키텍처의 강력한 인지 능력의 핵심 요소가 됩니다....
Total Context:
66K
Max output:
66K
Input:
$
0.1
/ M Tokens
Output:
$
0.4
/ M Tokens

Qwen
Text-to-Image
Qwen-Image
출시일: 2025. 9. 15.
$
0.02
/ Image


Qwen
Image-to-Image
Qwen-Image-Edit
출시일: 2025. 9. 18.
$
0.04
/ Image


Qwen
Text Generation
Qwen3-Coder-480B-A35B-Instruct
출시일: 2025. 7. 31.
Qwen3-Coder-480B-A35B-Instruct는 현재까지 Alibaba에서 출시한 가장 에이전트 구조의 코드 Model입니다. 이 Model은 4800억의 총 파라미터와 350억의 활성화된 파라미터를 가진 혼합 전문가 (MoE) Model로, 효율성과 성능의 균형을 이루고 있습니다. 이 Model은 자체적으로 256K (대략 262,144) token 컨텍스트 길이를 지원하며, YaRN과 같은 외삽 기법을 사용하여 최대 100만 token까지 확장할 수 있어 저장소 규모의 코드베이스와 복잡한 프로그래밍 작업을 처리할 수 있습니다. Qwen3-Coder는 에이전트 구조의 코딩 워크플로우를 위해 특별히 설계되었으며, 코드 생성뿐만 아니라 복잡한 문제를 해결하기 위해 개발자 도구 및 환경과 자동으로 상호작용합니다. 다양한 코딩 및 에이전트 벤치마크에서 개방형 Model 중 최첨단 결과를 달성하였으며, Claude Sonnet 4와 같은 선도적인 Model과 비교할 만한 성능을 보여줍니다. Model과 함께 Alibaba는 강력한 에이전트 코딩 기능을 완전히 발휘할 수 있도록 설계된 명령줄 도구인 Qwen Code도 오픈 소스화하였습니다....
Total Context:
262K
Max output:
262K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens

Qwen
Text Generation
Qwen3-Coder-30B-A3B-Instruct
출시일: 2025. 8. 1.
Qwen3-Coder-30B-A3B-Instruct는 Alibaba의 Qwen 팀이 개발한 Qwen3 시리즈의 코드 Model입니다. 간소화되고 최적화된 Model로서 뛰어난 성능과 효율성을 유지하면서 향상된 코딩 기능에 중점을 둡니다. Agentic Coding, Agentic Browser-Use 및 기타 기본 코딩 작업과 같은 복잡한 작업에서 오픈 소스 Model 중에서 상당한 성능 이점을 보여줍니다. 이 Model은 기본적으로 256K tokens의 긴 컨텍스트를 지원하며 최대 1M tokens까지 확장할 수 있어 더 나은 리포지토리 규모의 이해와 처리가 가능합니다. 또한 Qwen Code 및 CLINE과 같은 플랫폼에 대한 강력한 에이전틱 코딩 지원을 제공하며, 특별히 설계된 함수 호출 형식을 제공합니다....
Total Context:
262K
Max output:
262K
Input:
$
0.07
/ M Tokens
Output:
$
0.28
/ M Tokens

Qwen
Text Generation
Qwen3-30B-A3B-Instruct-2507
출시일: 2025. 7. 30.
Qwen3-30B-A3B-Instruct-2507은 비사고 모드의 Qwen3-30B-A3B 업데이트 버전입니다. 이는 305억 총 파라미터와 33억 활성화 파라미터를 가진 전문가 혼합 모델(Mixture-of-Experts (MoE) Model)입니다. 이 버전은 주요 개선사항을 특징으로 하고 있으며, 지시 사항 준수, 논리적 추론, 텍스트 이해, 수학, 과학, 코딩 및 도구 사용과 같은 일반적인 능력에서 상당한 향상을 포함합니다. 또한 다양한 언어에 걸쳐 장기적인 지식 범위에서 상당한 발전을 보여주며, 주관적이고 개방적인 과제에서 사용자 선호도에 맞춰 더 나은 정렬을 제공하여 더 유용한 응답과 높은 품질의 텍스트 생성이 가능합니다. 게다가, 장기 문맥 이해 능력이 256K로 강화되었습니다. 이 Model은 비사고 모드만 지원하며 Output에서 `<think></think>` 블록을 생성하지 않습니다....
Total Context:
262K
Max output:
262K
Input:
$
0.09
/ M Tokens
Output:
$
0.3
/ M Tokens

Qwen
Text Generation
Qwen3-30B-A3B-Thinking-2507
출시일: 2025. 7. 31.
Qwen3-30B-A3B-Thinking-2507은 Alibaba의 Qwen 팀에서 출시한 Qwen3 시리즈의 최신 사고 Model입니다. 305억 개의 총 매개 변수와 33억 개의 활성 매개 변수를 가진 Mixture-of-Experts (MoE) Model로서 복잡한 작업의 역량을 강화하는 데 중점을 두고 있습니다. 이 Model은 논리적 추론, 수학, 과학, 코딩 및 일반적으로 인간의 전문 지식이 필요한 학술 벤치마크를 포함한 추론 작업에서 눈에 띄게 향상된 성능을 보여줍니다. 또한 명령 따르기, 도구 사용, Text 생성 및 인간의 선호와의 정렬 등의 일반적인 역량에서도 크게 개선되었습니다. 이 Model은 기본적으로 256K 긴 문맥 이해 기능을 지원하며, 이는 100만 token까지 확장할 수 있습니다. 이 버전은 '사고 모드'를 통해 단계별 추론으로 매우 복잡한 문제를 해결하기 위해 특별히 설계되었으며, 능동적 역량에서도 뛰어납니다....
Total Context:
262K
Max output:
131K
Input:
$
0.09
/ M Tokens
Output:
$
0.3
/ M Tokens

Qwen
Text Generation
Qwen3-235B-A22B-Instruct-2507
출시일: 2025. 7. 23.
Qwen3-235B-A22B-Instruct-2507은 Alibaba Cloud의 Qwen 팀이 개발한 Qwen3 시리즈의 대표 Mixture-of-Experts (MoE) 대형 언어 Model입니다. 이 Model은 총 2,350억 개의 매개변수를 가지고 있으며, 매 포워드 패스당 220억 개가 활성화됩니다. 이는 Qwen3-235B-A22B 비사고 모드의 업데이트된 버전으로 출시되었으며, 지시 사항 따르기, 논리적 추론, Text 이해, 수학, 과학, 코딩 및 도구 사용과 같은 일반적인 기능 향상이 특징입니다. 또한, 다중 언어에서의 긴 꼬리 지식 범위에서 상당한 이점을 제공하며, 주관적이고 개방적인 작업에서 사용자 선호도와 더욱 잘 맞춰져 더욱 도움이 되는 응답과 고품질 Text 생성이 가능하게 합니다. 특히, 광범위한 256K (262,144 tokens) 컨텍스트 창을 본래 지원하여 장기 컨텍스트 이해의 기능을 향상시킵니다. 이 버전은 비사고 모드만을 독점적으로 지원하며, <think> 블록을 생성하지 않으며, 직접적인 Q&A 및 지식 검색과 같은 작업에 대한 더 효율적이고 정확한 응답을 제공하는 것을 목표로 합니다....
Total Context:
262K
Max output:
262K
Input:
$
0.09
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
Text Generation
Qwen3-235B-A22B-Thinking-2507
출시일: 2025. 7. 28.
Qwen3-235B-A22B-Thinking-2507은 Alibaba의 Qwen 팀이 개발한 Qwen3 대형 언어 모델 시리즈의 일원으로, 고도로 복잡한 추론 작업에 특화되어 있습니다. 이 Model은 혼합 전문가(MoE) 아키텍처에 기반하여 총 2350억 개의 매개변수와 토큰당 약 220억 개의 활성화된 매개변수를 가지고 있으며, 계산 효율성을 향상시키면서 강력한 성능을 유지합니다. 전용 'thinking' Model로서 논리적 추론, 수학, 과학, 코딩 및 학술 기준과 같은 인간 전문 지식이 요구되는 작업에서 크게 향상된 성능을 입증하여 오픈 소스 thinking Model 중 최첨단 결과를 달성합니다. 게다가, 이 Model은 지침 준수, 도구 사용 및 Text 생성과 같은 향상된 일반 기능을 제공하며, 256K의 긴 컨텍스트 이해 기능을 본래 지원하여 깊은 추론과 긴 문서 처리가 필요한 시나리오에 이상적입니다....
Total Context:
262K
Max output:
262K
Input:
$
0.13
/ M Tokens
Output:
$
0.6
/ M Tokens

Qwen
Text Generation
Qwen3-32B
출시일: 2025. 4. 30.
Qwen3-32B는 최신 대규모 언어 모델로, Qwen 시리즈에서 32.8B 파라미터를 보유하고 있습니다. 이 모델은 독창적으로 사고 모드(복잡한 논리적 추론, 수학 및 코딩)를 일반 대화용 비사고 모드로 원활하게 전환할 수 있도록 지원합니다. 수학, 코드 생성 및 상식적 논리 추론에서 이전 QwQ와 Qwen2.5 지시 모델을 뛰어넘는 크게 향상된 추론 능력을 보여줍니다. 이 모델은 창의적 글쓰기, 롤플레잉 및 다중 턴 대화에서 인간 선호도 조정에 뛰어납니다. 또한 100개 이상의 언어와 방언을 강력한 다국어 지시 따름 및 번역 기능을 통해 지원합니다....
Total Context:
131K
Max output:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

Qwen
Text Generation
Qwen3-14B
출시일: 2025. 4. 30.
Qwen3-14B는 14.8B 매개변수를 갖춘 Qwen 시리즈의 최신 대형 언어 모델입니다. 이 Model은 복잡한 논리적 추론, 수학, 코딩을 위한 사고 모드와 효율적이고 일반적인 대화를 위한 비사고 모드 간의 원활한 전환을 독특하게 지원합니다. 이는 수치, 코드 생성 및 상식적 논리 추론에서 이전 QwQ 및 Qwen2.5 교육 모델을 능가하는 상당히 향상된 추론 능력을 보여줍니다. 이 Model은 창의적 글쓰기, 롤플레잉 및 다중 턴 대화에 대한 인간 선호도 조정에 뛰어난 능력을 발휘합니다. 또한 강력한 다국어 지침 준수 및 번역 기능을 통해 100개 이상의 언어와 방언을 지원합니다....
Total Context:
131K
Max output:
131K
Input:
$
0.07
/ M Tokens
Output:
$
0.28
/ M Tokens

Qwen
Text Generation
Qwen3-8B
출시일: 2025. 4. 30.
Qwen3-8B는 Qwen 시리즈의 최신 대형 언어 모델로, 8.2B 매개변수를 가지고 있습니다. 이 Model은 독특하게 복잡한 논리적 추론, 수학, 코딩을 위한 사고 모드와 효율적이고 일반적인 대화를 위한 비사고 모드 간의 원활한 전환을 지원합니다. 이 모델은 수학, 코드 생성 및 상식적인 논리적 추론에서 이전 QwQ 및 Qwen2.5 지시 모델을 능가하는 상당히 향상된 추론 능력을 보여줍니다. 이 Model은 창의적 글쓰기, 역할극 및 다중 회전 대화에 대한 인간 선호 정렬에서 뛰어난 성과를 보입니다. 또한, 100개 이상의 언어 및 방언을 지원하며 강력한 다국어 지침 따르기 및 번역 기능을 제공합니다....
Total Context:
131K
Max output:
131K
Input:
$
0.06
/ M Tokens
Output:
$
0.06
/ M Tokens

Qwen
Reranker
Qwen3-Reranker-8B
출시일: 2025. 6. 6.
Qwen3-Reranker-8B는 Qwen3 시리즈에서 80억 개의 매개변수를 가진 Text 재정렬 Model입니다. 이 Model은 검색 결과의 품질을 개선하고 정제하기 위해 설계되었으며, 쿼리에 대한 관련성을 기반으로 문서를 정확하게 재정렬합니다. 강력한 Qwen3 기초 Model을 기반으로 구축되어, 최대 32k의 문맥 길이로 긴 Text를 이해하는 데 탁월하고 100개 이상의 언어를 지원합니다. Qwen3-Reranker-8B Model은 다양한 Text 및 코드 검색 시나리오에서 최첨단 성능을 제공하는 유연한 시리즈의 일부입니다....
$
0.04
/ M Tokens

Qwen
Embedding
Qwen3-Embedding-8B
출시일: 2025. 6. 6.
Qwen3-Embedding-8B는 Qwen3 Embedding 시리즈의 최신 독점 Model로, 텍스트 Embedding 및 랭킹 작업을 위해 specifically 설계되었습니다. Qwen3 시리즈의 밀집 기반 모델을 바탕으로 구축된 이 8B 파라미터 Model은 최대 32K의 컨텍스트 길이를 지원하며 최대 4096의 차원으로 Embedding을 생성할 수 있습니다. 이 Model은 100개 이상의 언어를 지원하는 뛰어난 다중언어 기능, 긴 텍스트 이해 및 추론 능력을 물려받았습니다. MTEB 다중언어 리더보드에서 1위를 차지했으며(2025년 6월 5일 기준, 점수 70.58), 텍스트 검색, 코드 검색, 텍스트 분류, 군집화 및 비 텍스트 마이닝을 포함한 다양한 작업에서 최첨단 성능을 보여줍니다. 이 Model은 특정 작업과 시나리오에서 향상된 성능을 위해 유연한 벡터 차원(32에서 4096)과 명령어 인식 기능을 제공합니다....
Input:
$
0.04
/ M Tokens

Qwen
Reranker
Qwen3-Reranker-4B
출시일: 2025. 6. 6.
Qwen3-Reranker-4B는 Qwen3 시리즈의 강력한 Text 재정렬 Model로, 40억 개의 매개변수를 특징으로 합니다. 이는 처음 문서 목록을 쿼리에 기반하여 재정렬함으로써 검색 결과의 관련성을 크게 향상시키도록 설계되었습니다. 이 Model은 32k 컨텍스트 길이까지의 장문에 대한 뛰어난 이해와 100개 이상의 언어에 걸친 강력한 기능 등을 포함한 Qwen3 기반의 핵심 강점을 계승하고 있습니다. 벤치마크에 따르면, Qwen3-Reranker-4B Model은 다양한 Text 및 코드 검색 평가에서 우수한 성능을 보여줍니다....
$
0.02
/ M Tokens

Qwen
Embedding
Qwen3-Embedding-4B
출시일: 2025. 6. 6.
Qwen3-Embedding-4B는 Qwen3 Embedding 시리즈의 최신 독점 Model로, 텍스트 Embedding 및 랭킹 작업을 위해 특별히 설계되었습니다. Qwen3 시리즈의 밀집된 기초 Model을 기반으로 구축된 이 4B 매개변수 Model은 최대 32K까지의 컨텍스트 길이를 지원하며 2560까지 차원의 Embedding을 생성할 수 있습니다. 이 Model은 100개 이상의 언어를 지원하면서 뛰어난 다국어 기능을 상속받았으며, 긴 텍스트 이해 및 추론 능력을 가지고 있습니다. MTEB 다국어 리더보드에서 69.45점의 뛰어난 성능을 달성했으며, 텍스트 검색, 코드 검색, 텍스트 분류, 군집화, 이중 텍스트 마이닝을 포함한 다양한 작업에서 탁월한 결과를 보여줍니다. Model은 특정 작업 및 시나리오에서의 향상된 성능을 위한 유연한 벡터 차원(32에서 2560까지)과 지침 인식 기능을 제공하여 효율성과 효과성 사이에서 최적의 균형을 제공합니다....
Input:
$
0.02
/ M Tokens

Qwen
Reranker
Qwen3-Reranker-0.6B
출시일: 2025. 6. 6.
Qwen3-Reranker-0.6B는 Qwen3 시리즈의 Text 재순위 지정 Model입니다. 이는 초기 검색 시스템의 결과를 주어진 쿼리에 대한 관련성을 기준으로 문서를 재정렬하여 정제하도록 특별히 설계되었습니다. 6억 개의 매개변수와 32k의 컨텍스트 길이를 가지며, 이 Model은 강력한 다국어(100개 이상의 언어 지원), 긴 Text 이해, 그리고 Qwen3 기반의 추론 능력을 활용합니다. 평가 결과에 따르면 Qwen3-Reranker-0.6B는 MTEB-R, CMTEB-R 및 MLDR을 포함한 다양한 Text 검색 벤치마크에서 강력한 성능을 발휘합니다....
$
0.01
/ M Tokens

Qwen
Embedding
Qwen3-Embedding-0.6B
출시일: 2025. 6. 6.
Qwen3-Embedding-0.6B는 Qwen3 Embedding 시리즈에서 최신의 독자적인 Model로, 특히 Text 임베딩 및 랭킹 작업을 위해 설계되었습니다. Qwen3 시리즈의 밀집 기반 Model을 토대로 구축된 이 0.6B 파라미터 Model은 최대 32K까지의 컨텍스트 길이를 지원하며 최대 1024 차원의 임베딩을 생성할 수 있습니다. 이 Model은 100개 이상의 언어를 지원하는 뛰어난 다국어 기능을 상속받아 긴 Text 이해 및 추론 능력을 갖추고 있습니다. MTEB 다국어 리더보드에서 강력한 성능(점수 64.33)을 달성하고, Text 검색, 코드 검색, Text 분류, 클러스터링, 이중텍스트 마이닝을 포함한 다양한 작업에서 우수한 결과를 보여줍니다. 이 Model은 유연한 벡터 차원(32에서 1024까지)과 지시 인식 기능을 제공하여 특정 작업 및 시나리오에서 성능을 향상시켜 효율성과 효과성 모두를 우선시하는 애플리케이션에 이상적인 선택입니다....
Input:
$
0.01
/ M Tokens

Qwen
Text Generation
Qwen2.5-VL-32B-Instruct
출시일: 2025. 3. 24.
Qwen2.5-VL-32B-Instruct는 Qwen 팀에서 출시한 다중 모달 대형 언어 모델로, Qwen2.5-VL 시리즈의 일부입니다. 이 Model은 일반 객체 인식에 능숙할 뿐만 아니라 Text, 차트, 아이콘, 그래픽 및 이미지 내 레이아웃을 분석하는 데 매우 능합니다. 이는 도구를 추론하고 동적으로 지시할 수 있는 시각적 에이전트 역할을 하며, 컴퓨터와 전화기를 사용할 수 있습니다. 또한 이 Model은 이미지 내 객체를 정확하게 로컬화하고, 송장 및 표와 같은 데이터에 대한 구조화된 Output을 생성할 수 있습니다. 이전 버전 Qwen2-VL과 비교하여, 이 버전은 강화 학습을 통해 수학적 및 문제 해결 능력이 향상되었으며, 인간의 선호도에 더 잘 맞추어지도록 응답 스타일이 조정되었습니다....
Total Context:
131K
Max output:
131K
Input:
$
0.27
/ M Tokens
Output:
$
0.27
/ M Tokens

Qwen
Text Generation
QwQ-32B
출시일: 2025. 3. 6.
QwQ는 Qwen 시리즈의 추론 모델입니다. 기존의 명령어 조정 모델과 비교했을 때, QwQ는 사고와 추론이 가능하여 특히 어려운 문제에서 다운스트림 작업에서 상당히 향상된 성능을 발휘할 수 있습니다. QwQ-32B는 중간 크기의 추론 모델로, 최신의 추론 모델들, 예를 들어 DeepSeek-R1, o1-mini와 경쟁력 있는 성능을 발휘할 수 있습니다. 이 Model은 RoPE, SwiGLU, RMSNorm, Attention QKV bias와 같은 기술을 64개의 레이어와 GQA 아키텍처의 8개 KV를 위한 40개의 Q 주의 집중 헤드를 포함하고 있습니다....
Total Context:
131K
Max output:
131K
Input:
$
0.15
/ M Tokens
Output:
$
0.58
/ M Tokens

Qwen
Text Generation
Qwen2.5-VL-72B-Instruct
출시일: 2025. 1. 28.
Qwen2.5-VL은 Qwen2.5 시리즈의 Vision-language Model로 여러 측면에서 상당한 향상을 보여줍니다: 강력한 비주얼 이해력을 갖추고 공통 사물을 인식하면서 이미지 내의 텍스트, 차트, 레이아웃을 분석할 수 있으며, 논리적 사고와 도구를 동적으로 지시할 수 있는 비주얼 에이전트로 기능합니다. 그것은 1시간 이상 길이의 Video를 이해하고 주요 이벤트를 포착할 수 있으며, 이미지 내 사물을 정확히 찾아 경계 상자 또는 포인트를 생성할 수 있습니다. 또한 송장 및 양식과 같은 스캔된 데이터에 대한 구조적 결과물을 지원합니다. 이 Model은 Image, Video, 에이전트 작업을 포함한 다양한 벤치마크에서 우수한 성능을 보여줍니다....
Total Context:
131K
Max output:
4K
Input:
$
0.59
/ M Tokens
Output:
$
0.59
/ M Tokens

Qwen
Text Generation
Qwen2.5-VL-7B-Instruct
출시일: 2025. 1. 28.
Qwen2.5-VL은 Qwen 시리즈의 새로운 구성원으로, 강력한 시각적 이해 능력을 갖추고 있습니다. 이 모델은 이미지 내 텍스트, 차트 및 레이아웃을 분석하고, 긴 동영상을 이해하며, 이벤트를 포착할 수 있습니다. 또한 추론, 도구 조작, 다중 형식 객체 로컬라이제이션 지원 및 구조화된 Outputs 생성을 할 수 있습니다. 이 Model은 동영상 이해에서 동적 해상도 및 프레임 속도 학습을 위해 최적화되었으며, 시각 인코더의 효율성을 개선하였습니다....
Total Context:
33K
Max output:
4K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens

Qwen
Text Generation
Qwen2.5-Coder-32B-Instruct
출시일: 2024. 11. 11.
Qwen2.5-Coder-32B-Instruct는 Qwen2.5를 기반으로 개발된 코드 전용 대형 언어 모델입니다. 이 모델은 5.5조 개의 tokens로 학습을 거쳐 코드 생성, 코드 추론 및 코드 수리에 있어 상당한 개선을 이뤄냈습니다. 현재 가장 진보된 오픈 소스 코드 언어 Model로서, 코드 작성 능력이 GPT-4와 견줄 만합니다. Model은 코드 작성 능력을 향상시켰을 뿐만 아니라 수학과 일반적인 능력에서도 강점을 유지하며, 긴 Text 처리도 지원합니다....
Total Context:
33K
Max output:
4K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens

Qwen
Text Generation
Qwen2.5-72B-Instruct-128K
출시일: 2024. 9. 18.
Qwen2.5-72B-Instruct는 Alibaba Cloud에서 출시한 최신 대형 언어 Model 시리즈 중 하나입니다. 이 72B Model은 코딩과 수학과 같은 분야에서 상당한 개선을 보여줍니다. 최대 128K tokens의 컨텍스트 길이를 지원합니다. Model은 또한 다국어 지원을 제공하며, 중국어, 영어 등을 포함한 29개 이상의 언어를 다룹니다. JSON 형식으로 특히 구조화된 Output을 생성하고, 데이터 구조를 이해하며, 지침을 따르는 데에 있어 주목할 만한 향상을 보여주었습니다....
Total Context:
131K
Max output:
4K
Input:
$
0.59
/ M Tokens
Output:
$
0.59
/ M Tokens

Qwen
Text Generation
Qwen2.5-72B-Instruct
출시일: 2024. 9. 18.
Qwen2.5-72B-Instruct는 Alibaba Cloud에서 발표한 최신 대형 언어 모델 시리즈 중 하나입니다. 이 72B 모델은 코딩과 수학 분야에서 상당한 향상을 보여줍니다. 이 모델은 또한 29개 이상의 언어를 지원하는 다국어 지원을 제공하며, 중국어와 영어를 포함합니다. 이 모델은 특히 JSON 형식에서 지시를 따르고, 구조화된 데이터를 이해하며, 구조화된 Output을 생성하는 데 있어 현저한 개선을 보여줍니다....
Total Context:
33K
Max output:
4K
Input:
$
0.59
/ M Tokens
Output:
$
0.59
/ M Tokens

Qwen
Text Generation
Qwen2.5-32B-Instruct
출시일: 2024. 9. 19.
Qwen2.5-32B-Instruct는 Alibaba Cloud에서 출시한 최신 대형 언어 모델 시리즈 중 하나입니다. 이 32B 모델은 코딩과 수학과 같은 분야에서 상당한 개선을 보여줍니다. 모델은 또한 다국어 지원을 제공하며 중국어, 영어 등 29개 이상의 언어를 포함합니다. 명령어를 따르는 것과 구조화된 데이터를 이해하는 것, 특히 JSON 형식으로 구조화된 출력물을 생성하는 데 있어 주목할 만한 향상을 보여줍니다....
Total Context:
33K
Max output:
4K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens

Qwen
Text Generation
Qwen2.5-14B-Instruct
출시일: 2024. 9. 18.
Qwen2.5-14B-Instruct는 Alibaba Cloud에서 출시한 최신 대형 언어 모델 시리즈 중 하나입니다. 이 14B 모델은 코딩 및 수학과 같은 분야에서 상당한 개선을 보여줍니다. 모델은 또한 중국어와 영어를 포함하여 29개 이상의 언어를 지원하는 다중 언어 지원을 제공합니다. 특히 JSON 형식으로 구조화된 출력 생성을 포함하여 지침을 따르고 구조화된 데이터를 이해하는 데 있어 주목할 만한 발전을 보여주고 있습니다....
Total Context:
33K
Max output:
4K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens

Qwen
Text Generation
Qwen2.5-7B-Instruct
출시일: 2024. 9. 18.
Qwen2.5-7B-Instruct는 Alibaba Cloud에서 출시한 최신 대형 언어 모델 시리즈 중 하나입니다. 이 7B 모델은 코딩 및 수학과 같은 분야에서 상당한 개선을 보여줍니다. 이 Model은 중국어, 영어를 포함하여 29개 이상의 언어를 지원하는 다국어 지원을 제공합니다. 또한, Model은 명령어 따르기, 구조화된 데이터 이해 및 구조화된 Outputs 생성, 특히 JSON에서 눈에 띄는 향상을 보여줍니다....
Total Context:
33K
Max output:
4K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens

