🎉 gemma-4-31B-it tersedia di SiliconFlow. Coba SEKARANG.

Model-model

Produk

Harga

Dokumen

Blog

Tentang

Kontak

State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

All

Featured

LLM

Vision

Image

Video

Audio

Serverless

DeepSeek

Text Generation

DeepSeek-V4-Pro

Dirilis pada: 24 Apr 2026

DeepSeek-V4-Pro is DeepSeek's flagship open-source MoE model with 1.6T total parameters and 49B activated, purpose-built for frontier-level reasoning, coding, and agentic tasks. Supporting a 1M-token context window and three reasoning effort modes up to Think Max, it achieves top-tier performance on coding benchmarks such as LiveCodeBench and Codeforces — rivaling leading closed-source models — and is released under the MIT License....

Total Context:

1049K

Max output:

393K

Input:

1.74

/ M Tokens

Input:

text

/ M Tokens

Output:

3.48

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V4-Flash

Dirilis pada: 24 Apr 2026

DeepSeek-V4-Flash is DeepSeek's latest open-source MoE model featuring 284B total parameters with only 13B activated during inference, delivering high-speed generation without sacrificing capability. With native support for a 1M-token context window and three switchable reasoning modes — Non-Think, Think High, and Think Max — it offers flexible intelligence scaling from everyday tasks to complex reasoning, all under the MIT License....

Total Context:

1049K

Max output:

393K

Input:

0.14

/ M Tokens

Input:

text

/ M Tokens

Output:

0.28

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3.2

Dirilis pada: 4 Des 2025

DeepSeek-V3.2 adalah sebuah Model yang mengharmoniskan efisiensi komputasi tinggi dengan keunggulan penalaran dan kinerja agen. Pendekatannya dibangun di atas tiga terobosan teknis utama: DeepSeek Sparse Attention (DSA), sebuah mekanisme perhatian yang efisien yang secara signifikan mengurangi kompleksitas komputasi sambil mempertahankan kinerja Model, yang dioptimalkan secara khusus untuk skenario konteks panjang; sebuah Kerangka Pembelajaran Penguatan yang Dapat Diskalakan, yang memungkinkan kinerja yang sebanding dengan GPT-5 dan kepiawaian penalaran yang setara dengan Gemini-3.0-Pro dalam varian komputasi tinggi; dan sebuah Large-Scale Agentic Task Synthesis Pipeline untuk mengintegrasikan penalaran ke dalam skenario penggunaan alat, meningkatkan kepatuhan dan generalisasi dalam lingkungan interaktif yang kompleks. Model ini telah mencapai kinerja medali emas dalam Olimpiade Matematika Internasional (IMO) 2025 dan Olimpiade Informatika Internasional (IOI)....

Total Context:

164K

Max output:

164K

Input:

0.27

/ M Tokens

Input:

text

/ M Tokens

Output:

0.42

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3.2-Exp

Dirilis pada: 10 Okt 2025

DeepSeek-V3.2-Exp adalah versi eksperimental dari model DeepSeek, dibangun di atas V3.1-Terminus. Ini memperkenalkan DeepSeek Sparse Attention(DSA) untuk pelatihan dan inference yang lebih cepat dan efisien pada konteks yang panjang....

Total Context:

164K

Max output:

164K

Input:

0.27

/ M Tokens

Input:

text

/ M Tokens

Output:

0.41

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3.1-Terminus

Dirilis pada: 29 Sep 2025

DeepSeek-V3.1-Terminus adalah versi terbaru yang dibangun di atas kekuatan V3.1 sambil menangani umpan balik pengguna utama. Ini meningkatkan konsistensi bahasa, mengurangi kejadian teks China-Inggris campuran dan karakter abnormal sesekali. Dan juga meningkatkan kinerja Agen Kode & Agen Pencarian yang lebih kuat....

Total Context:

164K

Max output:

164K

Input:

0.27

/ M Tokens

Input:

text

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3.1

Dirilis pada: 25 Agu 2025

DeepSeek-V3.1 adalah model hibrida yang mendukung mode berfikir dan mode tidak berfikir. Melalui optimalisasi pasca-pelatihan, performa model dalam penggunaan alat dan tugas agen telah meningkat secara signifikan. DeepSeek-V3.1-Think mencapai kualitas jawaban yang sebanding dengan DeepSeek-R1-0528, sambil merespons lebih cepat....

Total Context:

164K

Max output:

164K

Input:

0.27

/ M Tokens

Input:

text

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

Text Generation

DeepSeek-V3

Dirilis pada: 26 Des 2024

DeepSeek-V3-0324 menunjukkan perbaikan yang signifikan dibandingkan pendahulunya, DeepSeek-V3, dalam beberapa aspek kunci, termasuk peningkatan besar dalam kinerja penalaran, keterampilan pengembangan front-end yang lebih kuat, dan kemampuan penggunaan alat yang lebih cerdas....

Total Context:

164K

Max output:

164K

Input:

0.25

/ M Tokens

Input:

text

/ M Tokens

Output:

1.0

/ M Tokens

DeepSeek

Text Generation

DeepSeek-R1

Dirilis pada: 28 Mei 2025

DeepSeek-R1-0528 adalah model yang ditingkatkan menunjukkan peningkatan signifikan dalam menangani tugas penalaran kompleks, juga menawarkan tingkat halusinasi yang berkurang, dukungan yang ditingkatkan untuk pemanggilan fungsi, dan pengalaman yang lebih baik untuk pengkodean vibe. Ini mencapai kinerja yang sebanding dengan O3 dan Gemini 2.5 Pro....

Total Context:

164K

Max output:

164K

Input:

0.5

/ M Tokens

Input:

text

/ M Tokens

Output:

2.18