SiliconFlow에서 DeepSeek-V3.1: 하이브리드 사고, 더 스마트한 도구 및 164K 컨텍스트 창

2025. 9. 2.

요약: DeepSeek-V3.1, SiliconFlow에서 실행 중입니다! 고급 추론 기능, 164K 컨텍스트 윈도우 및 빠른 효율성으로 이제 SiliconFlow의 DeepSeek-V3.1 API를 Claude Code에 직접 통합하여 비용을 절감하면서 워크플로를 개선할 수 있습니다!

SiliconFlow는 DeepSeek-V3.1를 모델 카탈로그에 제공하게 되어 기쁩니다 — AI를 에이전트 시대에 더 가깝게 만드는 DeepSeek의 최신 업그레이드입니다. 하이브리드 사고 모드로 사용자는 필요에 따라 표준 및 심층 추론을 전환할 수 있으며, 더 똑똑해진 도구 호출과 더 빠른 추론이 매끄러운 사용자 경험을 제공합니다. 게다가 SiliconFlow는 최대 164K의 컨텍스트 윈도우를 지원하여 풍부한 대화, 더 긴 문서 처리 및 복잡한 작업을 쉽게 처리할 수 있습니다.

SiliconFlow의 DeepSeek-V3.1 API로 기대할 수 있는 것은:

예산 친화적인 가격: DeepSeek-V3.1 $0.27/M token (Input) 및 $1.1/M token (Output).
확장된 컨텍스트 윈도우: 복잡한 작업을 위한 164K 컨텍스트 윈도우.

스타트업이든 기업이든 상관없이, SiliconFlow는 실세계 애플리케이션에 원활하게 통합되는 제품 수준의 API를 제공하여 비용을 절감합니다.

DeepSeek-V3.1의 획기적인 성능

이전 버전과 비교하여, 이번 업그레이드는 여러 측면에서의 개선을 제공합니다:

하이브리드 사고 모드: 하나의 Model이 사고 모드와 비사고 모드를 채팅 템플릿 변경으로 모두 지원합니다.
더 똑똑한 도구 호출: 포스트 트레이닝 최적화를 통해 모델의 도구 사용 및 에이전트 작업 성능이 크게 향상되었습니다.
더 높은 사고 효율성: DeepSeek-V3.1-Think는 DeepSeek-R1-0528와 유사한 답변 품질을 제공하면서 더 빠르게 응답합니다.

이러한 개선의 배경에는 훈련에서의 큰 발전이 있습니다. DeepSeek-V3.1은 32K 단계(630B token)에서 10배 더 많은 데이터, 128K 단계(209B token)에서 3.3배 더 많은 데이터를 통해 롱 컨텍스트 확장 파이프라인을 확장합니다. 추가적인 롱-다큐먼트 데이터를 포함하고 UE8M0 FP8 형식으로 훈련하여, 모델은 더 큰 규모의 훈련을 더 빠른 Inference, 더 높은 효율성, 현대 인프라와의 원활한 호환성으로 전환합니다.

이것이 당신에게 의미하는 바:

더 긴 컨텍스트 윈도우: 전체 법적 계약서를 한 번에 검토하고, 큰 코드베이스를 청킹 없이 분석하거나 연구 논문을 시작부터 끝까지 처리할 수 있습니다. SiliconFlow를 통해 한 세션에서 4-5권의 노인과 바다를 처리할 수 있는 ~130,000단어 equivalent의 164K 컨텍스트 윈도우 — 아주 큰 문서와 복잡한 워크플로를 처리할 수 있습니다.
다양한 분야에서 더 나은 성능: 복잡한 수학 문제를 해결하거나 기술 문서를 작성하거나, 교차 분야의 추론 작업을 처리하는 데 있어, DeepSeek-V3.1은 확장된 훈련 데이터로 인해 더 정확하고 신뢰할 수 있는 Output을 제공합니다.
빠르고 효율적인 워크플로우: UE8M0 FP8 Precision 덕분에 더 낮은 컴퓨트 비용으로 빠른 응답을 생성할 수 있어 — 스타트업에게는 더 빠른 반복을, 기업에게는 더 효율적인 확장을 의미합니다.

기준 성능

DeepSeek-V3.1의 이점은 단순히 이론에 그치지 않습니다 — 실제 세계의 벤치마크에서 측정 가능한 개선으로 이어집니다:

코딩 & 실행: SWE의 코드 수정 평가 및 명령줄 터미널 환경에서의 복잡한 작업(터미널-벤치)에서 DeepSeek-V3.1은 이전 DeepSeek 시리즈 모델에 비해 눈에 띄는 향상을 보여줍니다.

카테고리	벤치마크 (메트릭)	DeepSeek V3.1-NonThinking	DeepSeek V3 0324	DeepSeek V3.1-Thinking	DeepSeek R1 0528
코드	SWE 검증됨	🥇66	45.4	-	44.6
	SWE-bench 다국어	🥇54.5	29.3	-	30.5
	터미널-벤치	🥇31.3	13.3	-	5.7

검색 및 추론: DeepSeek-V3.1은 여러 검색 평가 메트릭에서 상당한 개선을 달성합니다. 다단계 추론이 필요한 복잡한 검색 테스트(BrowseComp) 및 다학문적 전문 문제 테스트(HLE)에서 DeepSeek-V3.1의 성능이 R1-0528를 상당히 능가합니다.

카테고리	벤치마크 (메트릭)	DeepSeek V3.1-NonThinking	DeepSeek V3 0324	DeepSeek V3.1-Thinking	DeepSeek R1 0528
검색 에이전트	BrowseComp	-	-	🥇30	8.9
	BrowseComp_zh	-	-	🥇49.2	35.7
	Humanity's Last Exam	-	-	🥇29.8	24.8
	SimpleQA	-	-	🥇93.4	92.3

SiliconFlow의 DeepSeek-V3.1 API를 Claude Code에 활용하세요

이제 Claude Code가 DeepSeek Model을 지원함에 따라, SiliconFlow의 DeepSeek-V3.1 API를 통합할 수 있습니다.

1단계: SiliconFlow API Key 가져오기

SiliconFlow 대시보드에 로그인합니다.
API Key 섹션으로 이동합니다.
DeepSeek V3.1 접근을 위한 새로운 API Key를 생성합니다.
API Key를 복사하고 보안하게 유지합니다./

2단계: 환경 변수 구성하기

터미널을 열고 다음 환경 변수를 설정하세요:

export ANTHROPIC_BASE_URL="https://api.siliconflow.com/v1"
export ANTHROPIC_MODEL="deepseek-ai/DeepSeek-V3.1"  # You can modify this to use other models as needed
export ANTHROPIC_API_KEY="YOUR_SILICONFLOW_API_KEY" # Please replace with your actual API Key

3단계: Claude Code에서 DeepSeek V3.1 사용 시작하기

프로젝트 디렉터리로 이동하여 Claude Code를 실행하세요:

cd your-project-directory
claude

Claude Code는 이제 모든 코딩 지원 요구 사항에 대해 SiliconFlow의 API 서비스를 통해 DeepSeek V3.1을 사용합니다!

더 나아가, gen-cli 및 Cline을 통해서도 SiliconFlow의 DeepSeek v3.1 Model에 접근할 수 있습니다.

Gen-CLI

Gen-CLI는 오픈 소스 Gemini-CLI를 기반으로 하며 GitHub에서 이제 사용할 수 있습니다. 다음 단계로 설치하십시오:

시스템에 Node.js 18+이 설치되어 있는지 확인합니다.
API Key 환경 변수를 설정합니다:

export SILICONFLOW_API_KEY="YOUR_API_KEY"

Gen-CLI를 실행합니다:

npx를 통해:

npx https://github.com/gen-cli/gen-cli

또는 npm으로 설치:

npm install -g @gen-cli/gen-cli
gen

Cline

VSCode에서 Ctrl/Command+Shift+P로 명령 팔레트를 열고 Cline을 새 탭에서 구성합니다.

새 창에서 구성하십시오:

API 제공자: OpenAI 호환 가능을 선택합니다.
기본 URL: https://api.siliconflow.com/v1
API Key: https://cloud.siliconflow.com/account/ak에서 획득합니다.
Model ID: https://cloud.siliconflow.com/models에서 선택합니다.

Cline 사용 시작합니다.

즉시 시작하세요

탐색: SiliconFlow Playground에서 DeepSeek-V3.1을 시도해 보세요.
통합: 당사의 OpenAI 호환 API를 사용하세요. 전체 API 사양은 SiliconFlow API 문서에서 탐색하십시오.

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "deepseek-ai/DeepSeek-V3.1",
    "thinking_budget": 4096,
    "top_p": 0.7,
    "messages": [
        {
            "content": "tell me a story",
            "role": "user"
        }
    ],
    "enable_thinking": True
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.json())