State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

State-of-the-Art

AI Model Library

One API to run inference on 200+ cutting-edge AI models, and deploy in seconds

Qwen

Text Generation

Qwen3-VL-32B-Instruct

Dirilis pada: 21 Okt 2025

Qwen3-VL adalah model vision-language dalam seri Qwen3, mencapai performa state-of-the-art (SOTA) pada berbagai benchmark vision-language (VL). Model ini mendukung input Image dengan resolusi tinggi hingga level megapiksel dan memiliki kemampuan kuat dalam memahami visual secara umum, OCR multibahasa, pengkaitan visual yang detail, dan dialog visual. Sebagai bagian dari seri Qwen3, model ini mewarisi fondasi bahasa yang kuat, memungkinkannya memahami dan melaksanakan instruksi yang kompleks....

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

Text Generation

Qwen3-VL-32B-Thinking

Dirilis pada: 21 Okt 2025

Qwen3-VL-Thinking adalah versi dari seri Qwen3-VL yang dioptimalkan khusus untuk tugas penalaran visual yang kompleks. Ini mengintegrasikan "Mode Berpikir", yang memungkinkannya untuk menghasilkan langkah-langkah penalaran perantara yang rinci (Rantai-Pemikiran) sebelum memberikan jawaban akhir. Desain ini secara signifikan meningkatkan kinerja Model pada jawaban pertanyaan visual (VQA) dan tugas-tugas bahasa-vision lain yang memerlukan logika multi-langkah, perencanaan, dan analisis mendalam....

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

Text Generation

Qwen3-VL-8B-Instruct

Dirilis pada: 15 Okt 2025

Qwen3-VL-8B-Instruct adalah model vision-language dari seri Qwen3, yang menunjukkan kemampuan kuat dalam pemahaman visual umum, dialog yang berpusat pada visual, dan pengenalan Text multibahasa dalam Image....

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

Text Generation

Qwen3-VL-8B-Thinking

Dirilis pada: 15 Okt 2025

Qwen3-VL-8B-Thinking adalah model vision-bahasa dari seri Qwen3, dioptimalkan untuk skenario yang memerlukan penalaran kompleks. Dalam mode Thinking ini, model melakukan pemikiran dan penalaran langkah demi langkah sebelum memberikan jawaban akhir....

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

Text Generation

Qwen3-VL-235B-A22B-Instruct

Dirilis pada: 4 Okt 2025

Qwen3-VL-235B-A22B-Instruct adalah model Vision-bahasa Mixture-of-Experts (MoE) dengan 235 miliar parameter, dengan 22 miliar parameter yang diaktifkan. Ini adalah versi Qwen3-VL-235B-A22B yang disetel untuk instruksi dan selaras untuk aplikasi Chat....

Total Context:

262K

Max output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

Text Generation

Qwen3-VL-235B-A22B-Thinking

Dirilis pada: 4 Okt 2025

Qwen3-VL-235B-A22B-Thinking adalah salah satu model seri Qwen3-VL, edisi Thinking yang ditingkatkan untuk penalaran yang mencapai hasil state-of-the-art (SOTA) di berbagai tolok ukur penalaran Multimodal, unggul dalam STEM, matematika, analisis kausal, dan jawaban logis berbasis bukti. Ini menampilkan arsitektur Mixture-of-Experts (MoE) dengan total 235B parameter dan 22B parameter aktif....

Total Context:

262K

Max output:

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

Text Generation

Qwen3-VL-30B-A3B-Instruct

Dirilis pada: 5 Okt 2025

Seri Qwen3-VL menawarkan pemahaman & generasi Text yang superior, persepsi visual & penalaran yang lebih dalam, panjang konteks yang diperpanjang, pemahaman dinamika Video dan spasial yang ditingkatkan, serta kemampuan interaksi agen yang lebih kuat. Tersedia dalam arsitektur Dense dan MoE yang dapat diskalakan dari edge ke cloud, dengan edisi Thinking yang ditingkatkan oleh instruksi dan penalaran....

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

Text Generation

Qwen3-VL-30B-A3B-Thinking

Dirilis pada: 11 Okt 2025

Seri Qwen3-VL menawarkan pemahaman & generasi Text yang superior, persepsi visual & penalaran yang lebih dalam, panjang konteks yang diperpanjang, pemahaman dinamika Video dan spasial yang ditingkatkan, serta kemampuan interaksi agen yang lebih kuat. Tersedia dalam arsitektur Dense dan MoE yang dapat diskalakan dari edge ke cloud, dengan edisi Thinking yang ditingkatkan oleh instruksi dan penalaran....

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

Image-to-Video

Wan2.2-I2V-A14B

Dirilis pada: 13 Agu 2025

$

0.29

/ Video

Qwen

Text-to-Video

Wan2.2-T2V-A14B

Dirilis pada: 13 Agu 2025

$

0.29

/ Video

Qwen

Text Generation

Qwen3-Next-80B-A3B-Instruct

Dirilis pada: 18 Sep 2025

Qwen3-Next-80B-A3B-Instruct adalah model fondasi generasi berikutnya yang dirilis oleh tim Qwen dari Alibaba. Ini dibangun di atas arsitektur Qwen3-Next baru, yang dirancang untuk efisiensi pelatihan dan inference yang optimal. Model ini memasukkan fitur inovatif seperti mekanisme Hybrid Attention (Gated DeltaNet dan Gated Attention), struktur High-Sparsity Mixture-of-Experts (MoE), dan berbagai optimisasi stabilitas. Sebagai model sparse dengan 80 miliar parameter, model ini hanya mengaktifkan sekitar 3 miliar parameter per token selama inference, yang secara signifikan mengurangi biaya komputasi dan memberikan throughput lebih dari 10 kali lipat lebih tinggi daripada model Qwen3-32B untuk tugas konteks panjang yang melebihi 32K token. Ini adalah versi yang disetel untuk instruksi, dioptimalkan untuk tugas-tugas umum dan tidak mendukung mode 'pemikiran'. Dalam hal kinerja, model ini dapat dibandingkan dengan model unggulan Qwen, Qwen3-235B, pada beberapa tolok ukur, menunjukkan keunggulan signifikan dalam skenario konteks ultra-panjang....

Total Context:

262K

Max output:

262K

Input:

$

0.14

/ M Tokens

Output:

$

1.4

/ M Tokens

Qwen

Text Generation

Qwen3-Next-80B-A3B-Thinking

Dirilis pada: 25 Sep 2025

Qwen3-Next-80B-A3B-Thinking adalah model foundation generasi berikutnya dari tim Qwen Alibaba, yang dirancang khusus untuk tugas-tugas penalaran kompleks. Ini dibangun di atas arsitektur Qwen3-Next yang inovatif, yang menggabungkan mekanisme Perhatian Hibrid (Gated DeltaNet dan Gated Attention) dengan struktur High-Sparsity Mixture-of-Experts (MoE) untuk mencapai efisiensi pelatihan dan Inferensi akhir. Sebagai model jarang dengan 80 miliar parameter, ini hanya mengaktifkan sekitar 3 miliar parameter selama Inferensi, secara signifikan mengurangi biaya komputasi dan memberikan throughput lebih dari 10 kali lipat lebih tinggi dibandingkan dengan model Qwen3-32B pada tugas konteks panjang yang melebihi 32K tokens. Versi 'Thinking' ini dioptimalkan untuk masalah multi-langkah yang menuntut seperti pembuktian matematika, sintesis kode, analisis logis, dan perencanaan agentik, dan ini mengOutput jejak 'thinking' terstruktur secara default. Dalam hal performa, ini melampaui model yang lebih mahal seperti Qwen3-32B-Thinking dan telah mengungguli Gemini-2.5-Flash-Thinking pada berbagai tolok ukur....

Total Context:

262K

Max output:

262K

Input:

$

0.14

/ M Tokens

Output:

$

0.57

/ M Tokens

Qwen

Text Generation

Qwen3-Omni-30B-A3B-Captioner

Dirilis pada: 4 Okt 2025

Qwen3-Omni-30B-A3B-Captioner adalah Model Bahasa-Visi (VLM) dari tim Qwen Alibaba, bagian dari seri Qwen3. Ini dirancang khusus untuk menghasilkan keterangan gambar yang berkualitas tinggi, detail, dan akurat. Berdasarkan arsitektur Mixture of Experts (MoE) dengan total 30B parameter, model ini dapat memahami konten Image secara mendalam dan menerjemahkannya menjadi Text bahasa alami yang kaya....

Total Context:

66K

Max output:

66K

Input:

$

0.1

/ M Tokens

Output:

$

0.4

/ M Tokens

Qwen

Text Generation

Qwen3-Omni-30B-A3B-Instruct

Dirilis pada: 4 Okt 2025

Qwen3-Omni-30B-A3B-Instruct adalah anggota dari seri terbaru Qwen3 dari tim Qwen Alibaba. Ini adalah model Mixture of Experts (MoE) dengan total 30 miliar parameter dan 3 miliar parameter aktif, yang secara efektif mengurangi biaya inference sambil mempertahankan kinerja yang kuat. Model ini dilatih pada data multibahasa, multi-sumber, dan berkualitas tinggi, menunjukkan kinerja yang sangat baik dalam kemampuan dasar seperti dialog multibahasa, serta dalam pengkodean dan matematika....

Total Context:

66K

Max output:

66K

Input:

$

0.1

/ M Tokens

Output:

$

0.4

/ M Tokens

Qwen

Text Generation

Qwen3-Omni-30B-A3B-Thinking

Dirilis pada: 4 Okt 2025

Qwen3-Omni-30B-A3B-Thinking adalah komponen utama "Thinker" dalam arsitektur "Thinker-Talker" model omni-modal Qwen3-Omni. Ini dirancang khusus untuk memproses input multimodal, termasuk Text, Audio, Image, dan Video, dan untuk menjalankan penalaran rantai-pemikiran yang kompleks. Sebagai otak penalaran dari sistem, Model ini menyatukan semua Input ke dalam ruang representasional umum untuk pemahaman dan analisis, tetapi Output-nya hanya Text. Desain ini memungkinkannya unggul dalam menyelesaikan masalah kompleks yang membutuhkan pemikiran mendalam dan pemahaman lintas-modal, seperti masalah matematika yang disajikan dalam Image, menjadikannya kunci untuk kemampuan kognitif yang kuat dari seluruh arsitektur Qwen3-Omni....

Total Context:

66K

Max output:

66K

Input:

$

0.1

/ M Tokens

Output:

$

0.4

/ M Tokens

Qwen

Text-to-Image

Qwen-Image

Dirilis pada: 15 Sep 2025

$

0.02

/ Image

Qwen

Image-to-Image

Qwen-Image-Edit

Dirilis pada: 18 Sep 2025

$

0.04

/ Image

Qwen

Text Generation

Qwen3-Coder-480B-A35B-Instruct

Dirilis pada: 31 Jul 2025

Qwen3-Coder-480B-A35B-Instruct adalah Model kode agen yang paling canggih yang dirilis oleh Alibaba hingga saat ini. Ini adalah Model Mixture-of-Experts (MoE) dengan total 480 miliar parameter dan 35 miliar parameter aktif, menyeimbangkan efisiensi dan kinerja. Model ini secara native mendukung panjang konteks token 256K (sekitar 262.144), yang dapat diperpanjang hingga 1 juta token menggunakan metode ekstrapolasi seperti YaRN, memungkinkan untuk menangani basis kode dalam skala repositori dan tugas pemrograman yang kompleks. Qwen3-Coder dirancang khusus untuk alur kerja pengkodean agen, di mana ia tidak hanya menghasilkan kode tetapi juga berinteraksi secara otomatis dengan alat dan lingkungan pengembang untuk memecahkan masalah yang kompleks. Ini telah mencapai hasil terkini di antara Model terbuka pada berbagai tolok ukur pengkodean dan agen, dengan kinerja sebanding dengan Model terkemuka seperti Claude Sonnet 4. Selain Model, Alibaba juga telah membuka kode Qwen Code, alat baris perintah yang dirancang untuk sepenuhnya melepaskan kemampuan pengkodean agenik yang kuat...

Total Context:

262K

Max output:

262K

Input:

$

0.25

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

Text Generation

Qwen3-Coder-30B-A3B-Instruct

Dirilis pada: 1 Agu 2025

Qwen3-Coder-30B-A3B-Instruct adalah model kode dari seri Qwen3 yang dikembangkan oleh tim Qwen dari Alibaba. Sebagai model yang disederhanakan dan dioptimalkan, ini mempertahankan kinerja dan efisiensi yang mengesankan sambil berfokus pada peningkatan kemampuan pengkodean. Ini menunjukkan keunggulan kinerja yang signifikan di antara model open-source pada tugas-tugas kompleks seperti Pengkodean Agen, Penggunaan Browser Agen, dan tugas pengkodean mendasar lainnya. Model ini secara native mendukung konteks panjang 256K tokens, yang dapat diperluas hingga 1M tokens, memungkinkan pemahaman dan pemrosesan skala repositori yang lebih baik. Selain itu, ini menyediakan dukungan pengkodean agen yang kuat untuk platform seperti Qwen Code dan CLINE, menampilkan format panggilan fungsi yang dirancang khusus....

Total Context:

262K

Max output:

262K

Input:

$

0.07

/ M Tokens

Output:

$

0.28

/ M Tokens

Qwen

Text Generation

Qwen3-30B-A3B-Instruct-2507

Dirilis pada: 30 Jul 2025

Qwen3-30B-A3B-Instruct-2507 adalah versi terbaru dari mode non-berpikir Qwen3-30B-A3B. Ini adalah model Mixture-of-Experts (MoE) dengan total 30,5 miliar parameter dan 3,3 miliar parameter yang diaktifkan. Versi ini menampilkan peningkatan kunci, termasuk peningkatan signifikan dalam kemampuan umum seperti mengikuti instruksi, penalaran logis, pemahaman text, matematika, sains, pengkodean, dan penggunaan alat. Ini juga menunjukkan peningkatan substansial dalam cakupan pengetahuan jangka panjang di berbagai bahasa dan menawarkan penyelarasan yang jauh lebih baik dengan preferensi pengguna dalam tugas subjektif dan terbuka, memungkinkan respons yang lebih bermanfaat dan generasi text berkualitas tinggi. Selain itu, kemampuannya dalam pemahaman konteks panjang telah ditingkatkan menjadi 256K. Model ini hanya mendukung mode non-berpikir dan tidak menghasilkan blok `<think></think>` dalam output-nya....

Total Context:

262K

Max output:

262K

Input:

$

0.09

/ M Tokens

Output:

$

0.3

/ M Tokens

Qwen

Text Generation

Qwen3-30B-A3B-Thinking-2507

Dirilis pada: 31 Jul 2025

Qwen3-30B-A3B-Thinking-2507 adalah model berpikir terbaru dalam seri Qwen3, dirilis oleh tim Qwen dari Alibaba. Sebagai model Mixture-of-Experts (MoE) dengan total 30,5 miliar parameter dan 3,3 miliar parameter aktif, ia difokuskan untuk meningkatkan kemampuan dalam tugas-tugas kompleks. Model ini menunjukkan peningkatan kinerja yang signifikan pada tugas penalaran, termasuk penalaran logis, matematika, sains, pengkodean, dan tolok ukur akademik yang biasanya memerlukan keahlian manusia. Ini juga menunjukkan kemampuan umum yang jauh lebih baik, seperti mengikuti instruksi, penggunaan alat, Text generation, dan keselarasan dengan preferensi manusia. Model ini secara native mendukung kemampuan pemahaman konteks panjang 256K, yang dapat diperpanjang hingga 1 juta token. Versi ini secara khusus dirancang untuk ‘mode berpikir’ untuk menangani masalah yang sangat kompleks melalui penalaran langkah-demi-langkah dan juga unggul dalam kemampuan agentik....

Total Context:

262K

Max output:

131K

Input:

$

0.09

/ M Tokens

Output:

$

0.3

/ M Tokens

Qwen

Text Generation

Qwen3-235B-A22B-Instruct-2507

Dirilis pada: 23 Jul 2025

Qwen3-235B-A22B-Instruct-2507 adalah model bahasa besar Mixture-of-Experts (MoE) unggulan dari seri Qwen3, yang dikembangkan oleh tim Qwen dari Alibaba Cloud. Model ini memiliki total 235 miliar parameter, dengan 22 miliar yang diaktifkan per forward pass. Ini dirilis sebagai versi terbaru dari mode non-berpikir Qwen3-235B-A22B, dengan peningkatan signifikan dalam kemampuan umum seperti mengikuti instruksi, penalaran logis, pemahaman Text, matematika, sains, pemrograman, dan penggunaan alat. Selain itu, model ini memberikan peningkatan besar dalam cakupan pengetahuan long-tail di berbagai bahasa dan menunjukkan perbaikan yang signifikan dalam keselarasan dengan preferensi pengguna dalam tugas yang subjektif dan terbuka, memungkinkan tanggapan yang lebih membantu dan penghasilan Text berkualitas tinggi. Yang penting, model ini mendukung native window konteks 256K (262,144 tokens) yang luas, yang meningkatkan kemampuannya untuk pemahaman konteks panjang. Versi ini secara eksklusif mendukung mode non-berpikir dan tidak menghasilkan blok <think>, yang bertujuan untuk memberikan tanggapan yang lebih efisien dan tepat untuk tugas seperti tanya jawab langsung dan pengambilan pengetahuan....

Total Context:

262K

Max output:

262K

Input:

$

0.09

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

Text Generation

Qwen3-235B-A22B-Thinking-2507

Dirilis pada: 28 Jul 2025

Qwen3-235B-A22B-Thinking-2507 adalah anggota dari seri Model bahasa besar Qwen3 yang dikembangkan oleh tim Qwen Alibaba, yang mengkhususkan diri dalam tugas-tugas penalaran yang sangat kompleks. Model ini dibangun di atas arsitektur Mixture-of-Experts (MoE), dengan total 235 miliar parameter dan sekitar 22 miliar parameter teraktivasi per token, yang meningkatkan efisiensi komputasi sambil mempertahankan kinerja yang kuat. Sebagai Model 'thinking' yang berdedikasi, ia menunjukkan peningkatan kinerja yang signifikan pada tugas-tugas yang membutuhkan keahlian manusia, seperti penalaran logis, matematika, sains, pengkodean, dan tolok ukur akademis, mencapai hasil mutakhir di antara model thinking sumber terbuka. Selain itu, Model ini memiliki kemampuan umum yang ditingkatkan seperti mengikuti instruksi, penggunaan alat, dan generasi Text, dan mendukung secara native kemampuan pemahaman konteks panjang 256K, menjadikannya ideal untuk skenario-skenario yang memerlukan penalaran mendalam dan pemrosesan dokumen yang panjang....

Total Context:

262K

Max output:

262K

Input:

$

0.13

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

Text Generation

Qwen3-32B

Dirilis pada: 30 Apr 2025

Qwen3-32B adalah model bahasa besar terbaru dalam seri Qwen dengan 32.8B parameter. Model ini secara unik mendukung pergantian mulus antara mode berpikir (untuk penalaran logis yang kompleks, matematika, dan pemrograman) dan mode non-berpikir (untuk dialog yang efisien dan tujuan umum). Ini menunjukkan kemampuan penalaran yang sangat meningkat, melampaui model QwQ dan Qwen2.5 instruct sebelumnya dalam matematika, pembuatan kode, dan penalaran logis nalar sehat. Model ini unggul dalam penjajaran preferensi manusia untuk penulisan kreatif, bermain peran, dan dialog multi-giliran. Selain itu, mendukung lebih dari 100 bahasa dan dialek dengan instruksi multibahasa yang kuat dan kemampuan penerjemahan....

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.57

/ M Tokens

Qwen

Text Generation

Qwen3-14B

Dirilis pada: 30 Apr 2025

Qwen3-14B adalah model bahasa besar terbaru dalam seri Qwen dengan 14.8B parameter. Model ini secara unik mendukung pergantian mulus antara mode berpikir (untuk penalaran logis yang kompleks, matematika, dan pemrograman) dan mode non-berpikir (untuk dialog tujuan umum yang efisien). Ini menunjukkan kemampuan penalaran yang sangat ditingkatkan, melampaui model instruksi QwQ dan Qwen2.5 sebelumnya dalam matematika, pembuatan kode, dan penalaran logis berdasarkan akal sehat. Model ini unggul dalam penyelarasan preferensi manusia untuk penulisan kreatif, bermain peran, dan dialog multi-putaran. Selain itu, mendukung lebih dari 100 bahasa dan dialek dengan instruksi multibahasa yang kuat dan kemampuan terjemahan....

Total Context:

131K

Max output:

131K

Input:

$

0.07

/ M Tokens

Output:

$

0.28

/ M Tokens

Qwen

Text Generation

Qwen3-8B

Dirilis pada: 30 Apr 2025

Qwen3-8B adalah model bahasa besar terbaru dalam seri Qwen dengan 8,2 miliar parameter. Model ini secara unik mendukung perpindahan mulus antara mode berpikir (untuk penalaran logis yang kompleks, matematika, dan pemrograman) dan mode non-berpikir (untuk percakapan umum yang efisien dan multi-guna). Model ini menunjukkan kemampuan penalaran yang sangat ditingkatkan, melampaui model instruksi QwQ dan Qwen2.5 sebelumnya dalam matematika, pembuatan kode, dan penalaran logis umum. Model ini unggul dalam kesesuaian preferensi manusia untuk penulisan kreatif, permainan peran, dan dialog multi-putaran. Selain itu, model ini mendukung lebih dari 100 bahasa dan dialek dengan kemampuan mengikuti instruksi multibahasa yang kuat dan kemampuan terjemahan....

Total Context:

131K

Max output:

131K

Input:

$

0.06

/ M Tokens

Output:

$

0.06

/ M Tokens

Qwen

Reranker

Qwen3-Reranker-8B

Dirilis pada: 6 Jun 2025

Qwen3-Reranker-8B adalah model penyusunan ulang teks dengan 8 miliar parameter dari seri Qwen3. Model ini dirancang untuk menyempurnakan dan meningkatkan kualitas hasil pencarian dengan mengatur ulang dokumen secara akurat berdasarkan relevansinya terhadap sebuah kueri. Dibangun di atas model dasar Qwen3 yang kuat, model ini unggul dalam memahami teks panjang dengan panjang konteks 32k dan mendukung lebih dari 100 bahasa. Model Qwen3-Reranker-8B merupakan bagian dari seri fleksibel yang menawarkan kinerja mutakhir dalam berbagai skenario pengambilan teks dan kode....

$

0.04

/ M Tokens

Qwen

Embedding

Qwen3-Embedding-8B

Dirilis pada: 6 Jun 2025

Qwen3-Embedding-8B adalah model kepemilikan terbaru dalam seri Qwen3 Embedding, dirancang khusus untuk tugas penanaman dan perankingan Text. Dibangun di atas model dasar padat dari seri Qwen3, model 8B parameter ini mendukung panjang konteks hingga 32K dan dapat menghasilkan embedding dengan dimensi hingga 4096. Model ini mewarisi kemampuan multibahasa yang luar biasa yang mendukung lebih dari 100 bahasa, bersama dengan pemahaman dan keterampilan penalaran teks panjang. Model ini menempati peringkat No.1 di papan peringkat multibahasa MTEB (per 5 Juni 2025, skor 70.58) dan menunjukkan kinerja mutakhir dalam berbagai tugas termasuk pengambilan Text, pengambilan kode, klasifikasi Text, clustering, dan penambangan bitext. Model ini menawarkan dimensi vektor yang fleksibel (32 hingga 4096) dan kemampuan sadar instruksi untuk peningkatan kinerja dalam tugas dan skenario tertentu....

Input:

$

0.04

/ M Tokens

Qwen

Reranker

Qwen3-Reranker-4B

Dirilis pada: 6 Jun 2025

Qwen3-Reranker-4B adalah model reranking Text yang kuat dari seri Qwen3, menampilkan 4 miliar parameter. Ini dirancang untuk secara signifikan meningkatkan relevansi hasil pencarian dengan mengatur ulang daftar awal dokumen berdasarkan kueri. Model ini mewarisi kekuatan inti dari fondasi Qwen3-nya, termasuk pemahaman luar biasa terhadap Text panjang (hingga konteks sepanjang 32 ribu) dan kemampuan tangguh di lebih dari 100 bahasa. Menurut tolok ukur, model Qwen3-Reranker-4B menunjukkan kinerja superior dalam berbagai evaluasi pengambilan Text dan kode....

$

0.02

/ M Tokens

Qwen

Embedding

Qwen3-Embedding-4B

Dirilis pada: 6 Jun 2025

Qwen3-Embedding-4B adalah model kepemilikan terbaru dalam seri Qwen3 Embedding, yang dirancang khusus untuk tugas embedding teks dan peringkat. Dibangun di atas model dasar yang padat dari seri Qwen3, model parameter 4B ini mendukung panjang konteks hingga 32K dan dapat menghasilkan embedding dengan dimensi hingga 2560. Model ini mewarisi kemampuan multibahasa yang luar biasa yang mendukung lebih dari 100 bahasa, serta pemahaman teks panjang dan keterampilan penalaran. Model ini mencapai kinerja yang sangat baik pada papan peringkat multibahasa MTEB (skor 69,45) dan menunjukkan hasil luar biasa di berbagai tugas termasuk pengambilan kembali teks, pengambilan kembali kode, klasifikasi teks, pengelompokan, dan penambangan bitext. Model ini menawarkan dimensi vektor yang fleksibel (32 hingga 2560) dan kemampuan sadar instruksi untuk peningkatan kinerja dalam tugas dan skenario tertentu, memberikan keseimbangan optimal antara efisiensi dan efektivitas...

Input:

$

0.02

/ M Tokens

Qwen

Reranker

Qwen3-Reranker-0.6B

Dirilis pada: 6 Jun 2025

Qwen3-Reranker-0.6B adalah model pemeringkatan RAG dari seri Qwen3. Model ini dirancang khusus untuk memperbaiki hasil dari sistem pemulihan awal dengan mengatur ulang dokumen berdasarkan relevansinya dengan kueri tertentu. Dengan 0.6 miliar parameter dan panjang konteks 32k, Model ini memanfaatkan dukungan multibahasa yang kuat (mendukung lebih dari 100 bahasa), pemahaman RAG yang panjang, dan kemampuan penalaran dari fondasi Qwen3-nya. Hasil evaluasi menunjukkan bahwa Qwen3-Reranker-0.6B mencapai kinerja yang kuat di berbagai tolok ukur pengambilan RAG, termasuk MTEB-R, CMTEB-R, dan MLDR....

$

0.01

/ M Tokens

Qwen

Embedding

Qwen3-Embedding-0.6B

Dirilis pada: 6 Jun 2025

Qwen3-Embedding-0.6B adalah model eksklusif terbaru dalam seri Qwen3 Embedding, yang dirancang khusus untuk tugas penyematan dan peringkat text. Dibangun di atas model dasar padat dari seri Qwen3, model parameter 0.6B ini mendukung panjang konteks hingga 32K dan dapat menghasilkan embeddings dengan dimensi hingga 1024. Model ini mewarisi kemampuan multibahasa yang luar biasa mendukung lebih dari 100 bahasa, serta pemahaman teks panjang dan keterampilan penalaran. Mencapai kinerja yang kuat pada papan peringkat multibahasa MTEB (skor 64.33) dan menunjukkan hasil yang sangat baik di berbagai tugas termasuk pengambilan text, pengambilan kode, klasifikasi text, pengelompokan, dan penambangan bitext. Model ini menawarkan dimensi vektor fleksibel (32 hingga 1024) dan kemampuan instruksi-sadar untuk meningkatkan kinerja dalam tugas dan skenario tertentu, menjadikannya pilihan ideal untuk aplikasi yang memprioritaskan efisiensi dan efektivitas....

Input:

$

0.01

/ M Tokens

Qwen

Text Generation

Qwen2.5-VL-32B-Instruct

Dirilis pada: 24 Mar 2025

Qwen2.5-VL-32B-Instruct adalah model bahasa besar multimodal yang dirilis oleh tim Qwen, bagian dari seri Qwen2.5-VL. Model ini tidak hanya mahir dalam mengenali objek umum tetapi juga sangat mampu menganalisis teks, bagan, ikon, grafis, dan tata letak dalam image. Ini berfungsi sebagai agen visual yang dapat beralasan dan secara dinamis mengarahkan alat, mampu menggunakan komputer dan telepon. Selain itu, model ini dapat secara akurat melokalisasi objek dalam image, dan menghasilkan output terstruktur untuk data seperti faktur dan tabel. Dibandingkan dengan pendahulunya Qwen2-VL, versi ini memiliki kemampuan matematika dan pemecahan masalah yang ditingkatkan melalui pembelajaran penguatan, dengan gaya respons yang disesuaikan agar lebih selaras dengan preferensi manusia...

Total Context:

131K

Max output:

131K

Input:

$

0.27

/ M Tokens

Output:

$

0.27

/ M Tokens

Qwen

Text Generation

QwQ-32B

Dirilis pada: 6 Mar 2025

QwQ adalah model penalaran dari seri Qwen. Dibandingkan dengan model yang disesuaikan dengan instruksi konvensional, QwQ, yang mampu berpikir dan bernalar, dapat mencapai kinerja yang ditingkatkan secara signifikan dalam tugas hilir, terutama masalah yang sulit. QwQ-32B adalah model penalaran berukuran menengah, yang mampu mencapai kinerja kompetitif terhadap Model penalaran mutakhir, misalnya, DeepSeek-R1, o1-mini. Model ini menggabungkan teknologi seperti RoPE, SwiGLU, RMSNorm, dan bias Perhatian QKV, dengan 64 lapisan dan 40 kepala perhatian Q (8 untuk KV dalam arsitektur GQA)...

Total Context:

131K

Max output:

131K

Input:

$

0.15

/ M Tokens

Output:

$

0.58

/ M Tokens

Qwen

Text Generation

Qwen2.5-VL-72B-Instruct

Dirilis pada: 28 Jan 2025

Qwen2.5-VL adalah model bahasa-visual dalam seri Qwen2.5 yang menunjukkan peningkatan signifikan dalam beberapa aspek: ia memiliki kemampuan pemahaman visual yang kuat, mengenali objek umum sambil menganalisis teks, grafik, dan tata letak dalam Image; ia berfungsi sebagai agen visual yang mampu bernalar dan mengarahkan alat secara dinamis; ia dapat memahami Video lebih dari 1 jam dan menangkap peristiwa utama; ia secara akurat melokalisasi objek dalam Image dengan menghasilkan kotak batas atau titik; dan ia mendukung Output terstruktur untuk data yang dipindai seperti faktur dan formulir. Model ini menunjukkan performa yang sangat baik di berbagai tolok ukur termasuk tugas-tugas Image, Video, dan agen....

Total Context:

131K

Max output:

4K

Input:

$

0.59

/ M Tokens

Output:

$

0.59

/ M Tokens

Qwen

Text Generation

Qwen2.5-VL-7B-Instruct

Dirilis pada: 28 Jan 2025

Qwen2.5-VL adalah anggota baru dari seri Qwen, dilengkapi dengan kemampuan pemahaman visual yang kuat. Ini dapat menganalisis Text, diagram, dan tata letak dalam Image, memahami Video panjang, dan menangkap kejadian. Ini mampu bernalar, memanipulasi alat, mendukung lokalisasi objek multi-format, dan menghasilkan Output terstruktur. Model telah dioptimalkan untuk resolusi dinamis dan pelatihan laju bingkai dalam pemahaman Video, dan telah meningkatkan efisiensi encoder visual....

Total Context:

33K

Max output:

4K

Input:

$

0.05

/ M Tokens

Output:

$

0.05

/ M Tokens

Qwen

Text Generation

Qwen2.5-Coder-32B-Instruct

Dirilis pada: 11 Nov 2024

Qwen2.5-Coder-32B-Instruct adalah model bahasa besar khusus kode yang dikembangkan berdasarkan Qwen2.5. Model ini telah menjalani pelatihan dengan 5,5 triliun token, mencapai peningkatan signifikan dalam pembuatan kode, penalaran kode, dan perbaikan kode. Ini saat ini merupakan model bahasa kode sumber terbuka yang paling canggih, dengan kemampuan pemrograman yang sebanding dengan GPT-4. Model ini tidak hanya meningkatkan kemampuan pemrograman, tetapi juga mempertahankan kekuatan dalam matematika dan kemampuan umum, serta mendukung pemrosesan teks panjang....

Total Context:

33K

Max output:

4K

Input:

$

0.18

/ M Tokens

Output:

$

0.18

/ M Tokens

Qwen

Text Generation

Qwen2.5-72B-Instruct-128K

Dirilis pada: 18 Sep 2024

Qwen2.5-72B-Instruct adalah salah satu seri model bahasa besar terbaru yang dirilis oleh Alibaba Cloud. Model 72B ini menunjukkan peningkatan signifikan di bidang seperti pengkodean dan matematika. Ini mendukung panjang konteks hingga 128K tokens. Model ini juga menawarkan dukungan multibahasa, mencakup lebih dari 29 bahasa, termasuk Mandarin, Inggris, dan lainnya. Ini telah menunjukkan peningkatan yang signifikan dalam mengikuti instruksi, memahami data terstruktur, dan menghasilkan Output terstruktur, terutama dalam format JSON....

Total Context:

131K

Max output:

4K

Input:

$

0.59

/ M Tokens

Output:

$

0.59

/ M Tokens

Qwen

Text Generation

Qwen2.5-72B-Instruct

Dirilis pada: 18 Sep 2024

Qwen2.5-72B-Instruct adalah salah satu seri Model bahasa besar terbaru yang dirilis oleh Alibaba Cloud. Model 72B menunjukkan peningkatan signifikan dalam bidang seperti pemrograman dan matematika. Model ini juga menawarkan dukungan multibahasa, mencakup lebih dari 29 bahasa, termasuk bahasa Mandarin dan Inggris. Ini menunjukkan peningkatan yang signifikan dalam mengikuti instruksi, memahami data terstruktur, dan menghasilkan Output terstruktur, terutama dalam format JSON....

Total Context:

33K

Max output:

4K

Input:

$

0.59

/ M Tokens

Output:

$

0.59

/ M Tokens

Qwen

Text Generation

Qwen2.5-32B-Instruct

Dirilis pada: 19 Sep 2024

Qwen2.5-32B-Instruct adalah salah satu seri Model bahasa besar terbaru yang dirilis oleh Alibaba Cloud. Model 32B ini menunjukkan peningkatan yang signifikan dalam bidang seperti pemrograman dan matematika. Model ini juga menawarkan dukungan multi-bahasa, mencakup lebih dari 29 bahasa, termasuk Tionghoa, Inggris, dan lainnya. Ini menunjukkan peningkatan yang mencolok dalam mengikuti instruksi, memahami data terstruktur, dan menghasilkan Output terstruktur, terutama dalam format JSON....

Total Context:

33K

Max output:

4K

Input:

$

0.18

/ M Tokens

Output:

$

0.18

/ M Tokens

Qwen

Text Generation

Qwen2.5-14B-Instruct

Dirilis pada: 18 Sep 2024

Qwen2.5-14B-Instruct adalah salah satu seri model bahasa besar terbaru yang dirilis oleh Alibaba Cloud. Model 14B ini menunjukkan peningkatan signifikan di bidang seperti pengkodean dan matematika. Model ini juga menawarkan dukungan multi-bahasa, mencakup lebih dari 29 bahasa, termasuk bahasa Tionghoa dan Inggris. Ini telah menunjukkan kemajuan yang mencolok dalam mengikuti instruksi, memahami data terstruktur, dan menghasilkan Output terstruktur, terutama dalam format JSON....

Total Context:

33K

Max output:

4K

Input:

$

0.1

/ M Tokens

Output:

$

0.1

/ M Tokens

Qwen

Text Generation

Qwen2.5-7B-Instruct

Dirilis pada: 18 Sep 2024

Qwen2.5-7B-Instruct adalah salah satu dari seri model bahasa besar terbaru yang dirilis oleh Alibaba Cloud. Model 7B ini menunjukkan peningkatan signifikan dalam bidang seperti pengkodean dan matematika. Model ini juga menawarkan dukungan multibahasa, mencakup lebih dari 29 bahasa, termasuk bahasa Tionghoa, Inggris, dan lainnya. Model ini menunjukkan peningkatan yang signifikan dalam mengikuti instruksi, memahami data terstruktur, dan menghasilkan Output terstruktur, khususnya JSON....

Total Context:

33K

Max output:

4K

Input:

$

0.05

/ M Tokens

Output:

$

0.05

/ M Tokens

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow