목차
요약: DeepSeek-V3.1, SiliconFlow에서 실행 중입니다! 고급 추론 기능, 164K 컨텍스트 윈도우 및 빠른 효율성으로 이제 SiliconFlow의 DeepSeek-V3.1 API를 Claude Code에 직접 통합하여 비용을 절감하면서 워크플로를 개선할 수 있습니다!
SiliconFlow는 DeepSeek-V3.1를 모델 카탈로그에 제공하게 되어 기쁩니다 — AI를 에이전트 시대에 더 가깝게 만드는 DeepSeek의 최신 업그레이드입니다. 하이브리드 사고 모드로 사용자는 필요에 따라 표준 및 심층 추론을 전환할 수 있으며, 더 똑똑해진 도구 호출과 더 빠른 추론이 매끄러운 사용자 경험을 제공합니다. 게다가 SiliconFlow는 최대 164K의 컨텍스트 윈도우를 지원하여 풍부한 대화, 더 긴 문서 처리 및 복잡한 작업을 쉽게 처리할 수 있습니다.
SiliconFlow의 DeepSeek-V3.1 API로 기대할 수 있는 것은:
예산 친화적인 가격: DeepSeek-V3.1 $0.27/M token (Input) 및 $1.1/M token (Output).
확장된 컨텍스트 윈도우: 복잡한 작업을 위한 164K 컨텍스트 윈도우.
스타트업이든 기업이든 상관없이, SiliconFlow는 실세계 애플리케이션에 원활하게 통합되는 제품 수준의 API를 제공하여 비용을 절감합니다.
DeepSeek-V3.1의 획기적인 성능
이전 버전과 비교하여, 이번 업그레이드는 여러 측면에서의 개선을 제공합니다:
하이브리드 사고 모드: 하나의 Model이 사고 모드와 비사고 모드를 채팅 템플릿 변경으로 모두 지원합니다.
더 똑똑한 도구 호출: 포스트 트레이닝 최적화를 통해 모델의 도구 사용 및 에이전트 작업 성능이 크게 향상되었습니다.
더 높은 사고 효율성: DeepSeek-V3.1-Think는 DeepSeek-R1-0528와 유사한 답변 품질을 제공하면서 더 빠르게 응답합니다.
이러한 개선의 배경에는 훈련에서의 큰 발전이 있습니다. DeepSeek-V3.1은 32K 단계(630B token)에서 10배 더 많은 데이터, 128K 단계(209B token)에서 3.3배 더 많은 데이터를 통해 롱 컨텍스트 확장 파이프라인을 확장합니다. 추가적인 롱-다큐먼트 데이터를 포함하고 UE8M0 FP8 형식으로 훈련하여, 모델은 더 큰 규모의 훈련을 더 빠른 Inference, 더 높은 효율성, 현대 인프라와의 원활한 호환성으로 전환합니다.
이것이 당신에게 의미하는 바:
더 긴 컨텍스트 윈도우: 전체 법적 계약서를 한 번에 검토하고, 큰 코드베이스를 청킹 없이 분석하거나 연구 논문을 시작부터 끝까지 처리할 수 있습니다. SiliconFlow를 통해 한 세션에서 4-5권의 노인과 바다를 처리할 수 있는 ~130,000단어 equivalent의 164K 컨텍스트 윈도우 — 아주 큰 문서와 복잡한 워크플로를 처리할 수 있습니다.
다양한 분야에서 더 나은 성능: 복잡한 수학 문제를 해결하거나 기술 문서를 작성하거나, 교차 분야의 추론 작업을 처리하는 데 있어, DeepSeek-V3.1은 확장된 훈련 데이터로 인해 더 정확하고 신뢰할 수 있는 Output을 제공합니다.
빠르고 효율적인 워크플로우: UE8M0 FP8 Precision 덕분에 더 낮은 컴퓨트 비용으로 빠른 응답을 생성할 수 있어 — 스타트업에게는 더 빠른 반복을, 기업에게는 더 효율적인 확장을 의미합니다.
기준 성능
DeepSeek-V3.1의 이점은 단순히 이론에 그치지 않습니다 — 실제 세계의 벤치마크에서 측정 가능한 개선으로 이어집니다:
코딩 & 실행: SWE의 코드 수정 평가 및 명령줄 터미널 환경에서의 복잡한 작업(터미널-벤치)에서 DeepSeek-V3.1은 이전 DeepSeek 시리즈 모델에 비해 눈에 띄는 향상을 보여줍니다.
카테고리 | 벤치마크 (메트릭) | DeepSeek V3.1-NonThinking | DeepSeek V3 0324 | DeepSeek V3.1-Thinking | DeepSeek R1 0528 |
|---|---|---|---|---|---|
코드 | SWE 검증됨 | 🥇66 | 45.4 | - | 44.6 |
SWE-bench 다국어 | 🥇54.5 | 29.3 | - | 30.5 | |
터미널-벤치 | 🥇31.3 | 13.3 | - | 5.7 |
검색 및 추론: DeepSeek-V3.1은 여러 검색 평가 메트릭에서 상당한 개선을 달성합니다. 다단계 추론이 필요한 복잡한 검색 테스트(BrowseComp) 및 다학문적 전문 문제 테스트(HLE)에서 DeepSeek-V3.1의 성능이 R1-0528를 상당히 능가합니다.
카테고리 | 벤치마크 (메트릭) | DeepSeek V3.1-NonThinking | DeepSeek V3 0324 | DeepSeek V3.1-Thinking | DeepSeek R1 0528 |
|---|---|---|---|---|---|
검색 에이전트 | BrowseComp | - | - | 🥇30 | 8.9 |
BrowseComp_zh | - | - | 🥇49.2 | 35.7 | |
Humanity's Last Exam | - | - | 🥇29.8 | 24.8 | |
SimpleQA | - | - | 🥇93.4 | 92.3 | |
SiliconFlow의 DeepSeek-V3.1 API를 Claude Code에 활용하세요
이제 Claude Code가 DeepSeek Model을 지원함에 따라, SiliconFlow의 DeepSeek-V3.1 API를 통합할 수 있습니다.
1단계: SiliconFlow API Key 가져오기
SiliconFlow 대시보드에 로그인합니다.
API Key 섹션으로 이동합니다.
DeepSeek V3.1 접근을 위한 새로운 API Key를 생성합니다.
API Key를 복사하고 보안하게 유지합니다./

2단계: 환경 변수 구성하기
터미널을 열고 다음 환경 변수를 설정하세요:
3단계: Claude Code에서 DeepSeek V3.1 사용 시작하기
프로젝트 디렉터리로 이동하여 Claude Code를 실행하세요:
Claude Code는 이제 모든 코딩 지원 요구 사항에 대해 SiliconFlow의 API 서비스를 통해 DeepSeek V3.1을 사용합니다!
더 나아가, gen-cli 및 Cline을 통해서도 SiliconFlow의 DeepSeek v3.1 Model에 접근할 수 있습니다.
Gen-CLI
Gen-CLI는 오픈 소스 Gemini-CLI를 기반으로 하며 GitHub에서 이제 사용할 수 있습니다. 다음 단계로 설치하십시오:
시스템에 Node.js 18+이 설치되어 있는지 확인합니다.
API Key 환경 변수를 설정합니다:
Gen-CLI를 실행합니다:
npx를 통해:
또는 npm으로 설치:
Cline
VSCode에서
Ctrl/Command+Shift+P로 명령 팔레트를 열고 Cline을 새 탭에서 구성합니다.

새 창에서 구성하십시오:
API 제공자:
OpenAI 호환 가능을 선택합니다.기본 URL: https://api.siliconflow.com/v1
API Key: https://cloud.siliconflow.com/account/ak에서 획득합니다.
Model ID: https://cloud.siliconflow.com/models에서 선택합니다.
Cline 사용 시작합니다.
즉시 시작하세요
탐색: SiliconFlow Playground에서 DeepSeek-V3.1을 시도해 보세요.
통합: 당사의 OpenAI 호환 API를 사용하세요. 전체 API 사양은 SiliconFlow API 문서에서 탐색하십시오.
지금 SiliconFlow에서 DeepSeek-V3.1을 사용하여 애플리케이션에 더 빠르고, 더 스마트하고, 더 비용 효율적인 AI를 빌드하세요.

