DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-14B

deepseek-ai/DeepSeek-R1-Distill-Qwen-14B

정보에 대해서DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-14B는 Qwen2.5-14B를 기반으로 한 증류된 Model입니다. 이 Model은 DeepSeek-R1에 의해 생성된 80만 개의 큐레이션 샘플을 사용하여 미세 조정되었으며, 강력한 추론 능력을 보여줍니다. MATH-500에서 93.9%의 정확도, AIME 2024에서 69.7%의 통과율, CodeForces에서 1481의 등급을 달성하여 수학 및 프로그래밍 작업에서의 강력한 능력을 입증하였습니다.

사용 가능한 Serverless

쿼리를 즉시 실행하고 사용한 만큼만 지불하세요.

$

0.1

/

$

0.1

1M 토큰당 (Input/Output)

메타데이터

생성하다

2025. 1. 20.

라이센스

MIT LICENSE

공급자

DeepSeek

사양

Available

건축

교정된

아니요

전문가의 혼합

아니요

총 매개변수

14B

활성화된 매개변수

14B

추론

아니요

Precision

FP8

콘텍스트 길이

131K

Max Tokens

131K

지원됨 기능

Serverless

지원됨

Serverless LoRA

지원하지 않음

Fine-tuning

지원하지 않음

Embedding

지원하지 않음

Rerankers

지원하지 않음

지원 Image Input

지원하지 않음

JSON Mode

지원됨

구조화된 Outputs

지원하지 않음

도구

지원됨

Fim Completion

지원됨

Chat Prefix Completion

지원하지 않음

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow