정보에 대해서DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Qwen-32B는 Qwen2.5-32B를 기반으로 한 정제된 모델입니다. 이 Model은 DeepSeek-R1에 의해 생성된 80만 개의 큐레이트된 샘플을 사용하여 미세 조정되었으며, 수학, 프로그래밍 및 논리 작업 전반에 걸쳐 뛰어난 성능을 보여줍니다. AIME 2024, MATH-500 및 GPQA Diamond를 포함한 다양한 벤치마크에서 인상적인 결과를 달성했으며, 특히 MATH-500에서 94.3%의 정확도를 기록하여 뛰어난 수학적 추론 능력을 보여줍니다.
DeepSeek-R1-Distill-Qwen-32B의 뛰어난 추론, 수학적, 프로그래밍 능력을 탐구하여 복잡한 실제 문제를 해결할 수 있습니다.
고급 과학 문제 해결
DeepSeek-R1-Distill-Qwen-32B의 뛰어난 수학적 및 추론 능력을 활용하여 이론 물리학부터 생화학 RAG까지의 복잡한 과학적 과제를 해결하십시오.
사용 사례 예시:
"오류 수정을 위한 새로운 알고리즘을 도출하여 양자 컴퓨팅 팀의 연구 일정이 크게 가속화되었습니다."
다국어 코드 분석 및 개선
기본 디버깅을 넘어서 여러 언어로 된 대규모 코드베이스를 분석하여 미묘한 논리적 결함을 찾아내고, 알고리즘을 최적화하며, 시스템 보안을 강화하십시오.
사용 사례 예시:
"병행 실행 경로 추적으로 Rust 기반의 블록체인 애플리케이션에서 중요한 경쟁 조건을 식별하고, 정확하고 안전한 수정 방법을 제공했습니다."
정량적 금융 전략
광범위한 금융 데이터 세트에 대해 깊이 있는 정량 분석을 수행하여 복잡한 시장 패턴을 식별하고 견고한 알고리즘 트레이딩 또는 투자 전략을 수립하십시오.
사용 사례 예시:
"역사적 시장 데이터 및 경제 지표를 분석하여 기존 Model을 능가하는 고빈도 트레이딩 알고리즘을 개발했습니다."
지능형 시스템 및 규정 준수 감사
규제 문서에서 복잡한 엔지니어링 설계에 이르기까지 복잡한 시스템 감사를 자동화하여 규정 준수를 보장하고 중요한 취약성을 식별하십시오.
사용 사례 예시:
"GDPR 및 SOC 2와의 준수를 위해 대규모 클라우드 인프라 구성을 감사하여 여러 구성 오류를 지적하고 수정 단계를 제안했습니다."
메타데이터
사양
주
Deprecated
건축
Dense Transformer
교정된
아니요
전문가의 혼합
아니요
총 매개변수
32B
활성화된 매개변수
32B
추론
아니요
Precision
FP8
콘텍스트 길이
131K
Max Tokens
131K
다른 모델과 비교
이 Model이 다른 것들과 어떻게 비교되는지 보세요.
DeepSeek
chat
DeepSeek-V3.2
출시일: 2025. 12. 4.
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.42
/ M Tokens
DeepSeek
chat
DeepSeek-V3.2-Exp
출시일: 2025. 10. 10.
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
0.41
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1-Terminus
출시일: 2025. 9. 29.
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3.1
출시일: 2025. 8. 25.
Total Context:
164K
Max output:
164K
Input:
$
0.27
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-V3
출시일: 2024. 12. 26.
Total Context:
164K
Max output:
164K
Input:
$
0.25
/ M Tokens
Output:
$
1.0
/ M Tokens
DeepSeek
chat
DeepSeek-R1
출시일: 2025. 5. 28.
Total Context:
164K
Max output:
164K
Input:
$
0.5
/ M Tokens
Output:
$
2.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-32B
출시일: 2025. 1. 20.
Total Context:
131K
Max output:
131K
Input:
$
0.18
/ M Tokens
Output:
$
0.18
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-14B
출시일: 2025. 1. 20.
Total Context:
131K
Max output:
131K
Input:
$
0.1
/ M Tokens
Output:
$
0.1
/ M Tokens
DeepSeek
chat
DeepSeek-R1-Distill-Qwen-7B
출시일: 2025. 1. 20.
Total Context:
33K
Max output:
16K
Input:
$
0.05
/ M Tokens
Output:
$
0.05
/ M Tokens
