목차
요약: DeepSeek-V3.2 (V3.2-Exp의 공식 버전)이 이제 SiliconFlow에서 라이브입니다. 에이전트를 위한 추론 우선 모델로, 높은 효율성을 GPT-5 수준의 추론 성능과 164K 컨텍스트 윈도우와 결합합니다. 또한 사고 모드에서 도구 사용 기능을 갖추고 있으며, 85K+ 복잡한 지침과 1,800+ 환경에서 검증되었습니다. 오늘부터 SiliconFlow의 API를 사용하여 에이전트 워크플로우를 강화하세요.
DeepSeek의 최신 모델, DeepSeek-V3.2에 대한 액세스를 열게 되어 기쁩니다. 이는 계산 효율성과 우수한 추론 및 에이전트 성능을 조화롭게 결합한 새로운 시리즈입니다. 사고를 도구 사용에 직접 통합한 첫 번째 DeepSeek Model로서, DeepSeek-V3.2는 GPT-5 수준의 추론을 제공하며 출력이 상당히 짧습니다. 한편, DeepSeek-V3.2-Speciale은 정리 증명 및 코딩의 오픈 소스 경계를 확장하여 Gemini 3 Pro와 경쟁합니다. 함께 이들은 차세대 AI 에이전트를 구축하려는 개발자들에게 새로운 기준을 제시합니다.
이제, SiliconFlow의 DeepSeek-V3.2 API를 통해 다음 기능을 기대할 수 있습니다:
경제적인 가격 책정:
DeepSeek-V3.2 $0.27/백만 token (입력) 및 $0.42/백만 token (출력)
DeepSeek-V3.2-Speciale는 곧 출시 예정이며 직접 최신 정보를 확인하세요
164K 컨텍스트 윈도우: 긴 문서, 복잡한 다회전 대화 및 확장된 에이전트 작업에 적합합니다.
원활한 통합: SiliconFlow의 OpenAI 호환 API를 통해 즉시 배포하거나 Claude Code, Gen-CLI 및 Cline을 통해 기존 스택에 플러그인하세요.
에이전트, 코딩 어시스턴트, 또는 복잡한 추론 파이프라인을 구축하고 있든 간에, SiliconFlow의 DeepSeek-V3.2 API는 기대되는 비용과 지연 시간의 일부로 필요한 성능을 제공합니다.
왜 중요한가
에이전트를 구축하거나, 다단계 추론 파이프라인 또는 사고하고 행동할 수 있는 AI 시스템을 필요로 하는 개발자들에게 DeepSeek-V3.2 시리즈는 업계가 기다리던 조합을 제공합니다: 최첨단 추론, 사고 중 도구 사용 통합, 및 현실 세계의 효율성:
세계 최고 수준의 추론 능력
DeepSeek-V3.2: 에이전트를 위한 효율적인 "데일리 드라이버"
추론 능력과 출력 길이 사이에서 완벽한 균형을 이루도록 설계된 DeepSeek-V3.2는 고급 Q&A 및 일반 에이전트 작업과 같은 프로덕션 워크플로우의 기본 선택입니다.
성능: GPT-5 수준의 추론 능력을 제공합니다.
효율성: Kimi-K2-Thinking과 비교했을 때, V3.2는 출력 길이가 상당히 짧아,더 낮은 계산 오버헤드와 전체 생성 시간 단축을 실현합니다.
DeepSeek-V3.2-Speciale: 최대 추론 능력 (연구 미리보기)
V3.2의 향상된 장기 사고 변형인 V3.2-Speciale은 DeepSeek-Math-V2의 정리 증명 능력을 통합하여 오픈 소스 추론 능력의 경계를 확장하려고 합니다.
금메달급 성능: V3.2-Speciale은 IMO, CMO, ICPC World Finals & IOI 2025에서 금메달급 결과를 달성합니다.
벤치마크: 복잡한 지침 따르기, 엄격한 수학적 추론 및 논리적 검증에서 Gemini 3 Pro와 효과적으로 경쟁합니다.
벤치마크 | DeepSeek-V3.2 Speciale | DeepSeek-V3.2 Thinking | GPT-5 High | Gemini-3.0 Pro | Kimi-K2 Thinking |
AIME 2025 | 🥇96.0 (23k) | 93.1 (16k) | 94.6 (13k) | 95.0 (15k) | 94.5 (24k) |
HMMT Feb 2025 | 🥇99.2 (27k) | 92.5 (19k) | 88.3 (16k) | 97.5 (16k) | 89.4 (31k) |
HMMT Nov 2025 | 🥇94.4 (25k) | 90.2 (18k) | 89.2 (20k) | 93.3 (15k) | 89.2 (29k) |
IMOAnswerBench | 🥇84.5 (45k) | 78.3 (27k) | 76.0 (31k) | 83.3 (18k) | 78.6 (37k) |
LiveCodeBench | 88.7 (27k) | 83.3 (16k) | 84.5 (13k) | 90.7 (13k) | 82.6 (29k) |
CodeForces | 2701 (77k) | 2386 (42k) | 2537 (29k) | 2708 (22k) | - |
GPQA Diamond | 85.7 (16k) | 82.4 (7k) | 85.7 (8k) | 91.9 (8k) | 84.5 (12k) |
HLE | 30.6 (35k) | 25.1 (21k) | 26.3 (15k) | 37.7 (15k) | 23.9 (24k) |
괄호 안의 숫자는 대략적인 총 token 소비량을 나타냅니다.
도구 사용 중 사고
DeepSeek-V3.2는 "추론"과 "행동" 사이의 장벽을 허물었습니다. 이전 버전에서는 사고 과정 중 도구 사용이 제한되었지만, DeepSeek-V3.2는 생각을 도구 사용에 직접 통합하여 사고 및 비사고 모드 모두에서 도구 호출을 지원하는 첫 번째 모델입니다.
이 수준의 에이전트 신뢰성을 제공하기 위해 DeepSeek는 대규모 훈련 합성 방법을 도입하였습니다:
강력한 일반화: 이 Model은 "풀기 어려우면서 검증은 쉬운" 강화 학습 과제를 통해 단련되었습니다.
광범위한 적용 범위: 훈련은 1,800+ 개의 개별 환경과 85,000+ 복잡한 지침을 포괄하여, 에이전트 맥락에서 Model의 일반화 및 지침 따르기 능력을 크게 향상시켰습니다.
벤치마크 | DeepSeek-V3.2-Thinking | GPT-5-High | Gemini-3.0-Pro | Kimi-K2-Thinking | MiniMax M2 |
τ² Bench (Pass@1) | 80.3 | 80.2 | 85.4 | 74.3 | 76.9 |
MCP-Universe | 45.9 | 47.9 | 50.7 | 35.6 | 29.4 |
MCP-Mark | 38 | 50.9 | 43.1 | 20.4 | 24.4 |
도구 Decathlon (Pass@1) | 35.2 | 29 | 36.4 | 17.6 | 16 |
귀하의 워크플로우에 대한 의미:
DeepSeek-V3.2는 에이전트 시나리오에서 매우 비용 효율적인 대안으로 나타나며, 개방형 및 최첨단 독점 모델들 사이의 성능 격차를 상당히 줄이면서도 비용은 훨씬 적게 발생합니다 - 모든 것이 SiliconFlow의 API를 통해 가능합니다.
SiliconFlow의 DeepSeek-V3.2 API를 사용하여 실시간 상호작용 코드에 대해 작성, 최적화 및 추론하는 방법을 보여주는 예를 확인하세요.

강력함의 이유
DeepSeek-V3.2 시리즈의 성능은 세 가지 핵심 기술 혁신에 의해 가능해졌습니다:
DeepSeek Sparse Attention (DSA):
긴 컨텍스트 처리의 문제를 해결하기 위해, 이 Model은 DeepSeek Sparse Attention (DSA)을 도입했습니다. 이 효율적인 주의 메커니즘은 성능을 손상시키지 않으면서 계산 복잡성을 크게 줄이며, 긴 컨텍스트 시나리오에 최적화되어 있습니다.
확장 가능한 강화 학습:
DeepSeek-V3.2는 강력한 강화 학습 (RL) 프로토콜과 확장된 사후 훈련 계산을 결합한 방법을 활용합니다. 이 고급 훈련 프레임워크는 Model의 뛰어난 추론 능력의 주요 원동력입니다.
대규모 에이전트 작업 합성 파이프라인:
DeepSeek은 참신한 대규모 에이전트 작업 합성 파이프라인을 통해 에이전트 역량을 혁신했습니다. 체계적으로 대규모 훈련 데이터를 생성하여, Model은 추론을 직접적으로 도구 사용 시나리오에 통합합니다. 이는 더 우수한 준법성과 일반화를 초래하며, 귀하의 에이전트가 복잡하고 다단계의 상호작용 환경을 정확히 탐색할 수 있도록 보장합니다.
개발자 친화적인 통합
DeepSeek-V3.2의 업계 최고 에이전트 성능을 넘어, SiliconFlow는 귀하의 기존 개발 생태계와의 즉각적인 호환성을 제공합니다:
OpenAI 호환 도구: Cline, Qwen Code, Gen-CLI 및 기타 표준 개발 환경과의 원활한 통합 — SiliconFlow API 키를 플러그인하세요.
Anthropic 호환 API: 코드 리뷰, 디버깅 및 아키텍처 리팩토링을 위해 Claude Code 및 모든 Anthropic 호환 도구에서 작동합니다.
플랫폼 통합: Dify, ChatHub, Chatbox, Sider, MindSearch, DB-GPT에서 바로 사용할 수 있으며 OpenRouter를 통해서도 사용할 수 있습니다.
강력한 모델, 원활한 통합 및 경쟁력 있는 가격으로 SiliconFlow는 구축 방식을 혁신하여 더 빨리 출하시킬 수 있게 하고, 더 스마트하게 확장할 수 있게 합니다.
즉시 시작하세요
탐색하기: SiliconFlow Playground에서 DeepSeek-V3.2를 시도해 보세요.
통합하기: OpenAI 호환 API를 사용하세요. SiliconFlow API 문서에서 전체 API 사양을 탐색하세요.

