SiliconFlow – ИИ-инфраструктура для LLMs и мультимодальных Models

Модели

Продукты

Цены

Документация

Блог

О

Контакт

🎉 LongCat-2.0 доступно на SiliconFlow. Попробуйте это СЕЙЧАС.

All

Featured

LLM

Vision

Image

Video

Audio

Serverless

DeepSeek

Text Generation

DeepSeek-V3.2

Выпуск: 4 дек. 2025 г.

DeepSeek-V3.2 — это модель, которая сочетает в себе высокую вычислительную эффективность с превосходной способностью к рассуждению и агентской производительности. Ее подход основывается на трех ключевых технических прорывах: DeepSeek Sparse Attention (DSA), эффективном механизме внимания, который существенно снижает вычислительную сложность при сохранении производительности модели, специально оптимизированной для сценариев с длинным контекстом; масштабируемой структуры обучения с подкреплением, которая позволяет достичь производительности, сопоставимой с GPT-5, и уровня рассуждений на уровне Gemini-3.0-Pro в его варианте с высокими вычислительными ресурсами; и крупномасштабного конвейера синтеза агентских задач, чтобы интегрировать рассуждения в сценарии использования инструментов, улучшая соответствие и обобщение в сложных интерактивных средах. Модель достигла золотого уровня производительности на Международной математической олимпиаде (IMO) и Международной олимпиаде по информатике (IOI) в 2025 году....

Total Context:

164K

Max output:

164K

Input:

0.27

/ M Tokens

Input:

text

/ M Tokens

Output:

0.42

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3.2-Exp

Выпуск: 10 окт. 2025 г.

DeepSeek-V3.2-Exp — это экспериментальная версия модели DeepSeek, созданная на основе V3.1-Terminus. В ней дебютирует разреженное внимание DeepSeek (DSA) для более быстрого и эффективного обучения и Inference на длинном контексте....

Total Context:

164K

Max output:

164K

Input:

0.27

/ M Tokens

Input:

text

/ M Tokens

Output:

0.41

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3.1-Terminus

Выпуск: 29 сент. 2025 г.

DeepSeek-V3.1-Терминус — это обновленная версия, построенная на сильных сторонах V3.1 с учетом ключевых отзывов пользователей. Она улучшает языковую согласованность, уменьшая количество случаев смешанного китайско-английского текста и периодически встречающихся аномальных символов. Также она обновляет более сильные агенты кода и агенты поиска....

Total Context:

164K

Max output:

164K

Input:

0.27

/ M Tokens

Input:

text

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3.1

Выпуск: 25 авг. 2025 г.

DeepSeek-V3.1 — это гибридная Model, поддерживающая как режим мышления, так и режим без мышления. Благодаря оптимизации после обучения, производительность Model в использовании инструментов и выполнении задач агентами значительно улучшилась. DeepSeek-V3.1-Think достигает качества ответов, сопоставимого с DeepSeek-R1-0528, при этом отвечая быстрее....

Total Context:

164K

Max output:

164K

Input:

0.27

/ M Tokens

Input:

text

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3

Выпуск: 26 дек. 2024 г.

DeepSeek-V3-0324 демонстрирует заметные улучшения по сравнению со своим предшественником, DeepSeek-V3, в нескольких ключевых аспектах, включая значительное повышение производительности рассуждений, более сильные навыки фронтенд-разработки и более умелые возможности использования инструментов....

Total Context:

164K

Max output:

164K

Input:

0.25

/ M Tokens

Input:

text

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

Text Generation

DeepSeek-R1

Выпуск: 28 мая 2025 г.

DeepSeek-R1-0528 — это обновленная Model, показывающая значительные улучшения в решении сложных задач рассуждения, а также предлагающая сниженную частоту галлюцинаций, улучшенную поддержку вызова функций и лучшее качество работы с кодированием атмосферы. Она достигает производительности, сопоставимой с O3 и Gemini 2.5 Pro....

Total Context:

164K

Max output:

164K

Input:

0.5

/ M Tokens

Input:

text

/ M Tokens

Output:

2.18

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V4-Pro

Выпуск: 24 апр. 2026 г.

DeepSeek-V4-Pro is DeepSeek's flagship open-source MoE model with 1.6T total parameters and 49B activated, purpose-built for frontier-level reasoning, coding, and agentic tasks. Supporting a 1M-token context window and three reasoning effort modes up to Think Max, it achieves top-tier performance on coding benchmarks such as LiveCodeBench and Codeforces — rivaling leading closed-source models — and is released under the MIT License....

Total Context:

1049K

Max output:

393K

Input:

1.6

/ M Tokens

Input:

text

/ M Tokens

Output:

3.135

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V4-Flash

Выпуск: 24 апр. 2026 г.

DeepSeek-V4-Flash is DeepSeek's latest open-source MoE model featuring 284B total parameters with only 13B activated during inference, delivering high-speed generation without sacrificing capability. With native support for a 1M-token context window and three switchable reasoning modes — Non-Think, Think High, and Think Max — it offers flexible intelligence scaling from everyday tasks to complex reasoning, all under the MIT License....

Total Context:

1049K

Max output:

393K

Input:

0.13

/ M Tokens

Input:

text

/ M Tokens

Output:

0.28