DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

정보에 대해서DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B는 Qwen2.5-Math-7B를 기반으로 하는 디스틸 Model입니다. 이 Model은 DeepSeek-R1에 의해 생성된 80만 개의 큐레이팅된 샘플을 사용하여 미세 조정되었으며, 뛰어난 추론 능력을 보여줍니다. MATH-500에서 92.8%의 정확도, AIME 2024에서 55.5%의 합격률, CodeForces에서 1189의 평가를 달성하며, 7B 규모의 Model로서 뛰어난 수학적 및 프로그래밍 능력을 보여줍니다.

사용 가능한 Serverless

쿼리를 즉시 실행하고 사용한 만큼만 지불하세요.

$

0.05

/

$

0.05

1M 토큰당 (Input/Output)

메타데이터

생성하다

2025. 1. 20.

라이센스

MIT LICENSE

공급자

DeepSeek

사양

Available

건축

교정된

아니요

전문가의 혼합

아니요

총 매개변수

7B

활성화된 매개변수

7B

추론

아니요

Precision

FP8

콘텍스트 길이

33K

Max Tokens

16K

지원됨 기능

Serverless

지원됨

Serverless LoRA

지원하지 않음

Fine-tuning

지원하지 않음

Embedding

지원하지 않음

Rerankers

지원하지 않음

지원 Image Input

지원하지 않음

JSON Mode

지원됨

구조화된 Outputs

지원하지 않음

도구

지원됨

Fim Completion

지원됨

Chat Prefix Completion

지원하지 않음

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow