Model-model

Produk

Harga

Dokumen

Blog

Tentang

Kontak

🎉 gemma-4-12B-it tersedia di SiliconFlow. Coba SEKARANG.

🎉 gemma-4-12B-it tersedia di SiliconFlow. Coba SEKARANG.

Model-model

Hunyuan-A13B-Instruct

Hunyuan-A13B-Instruct

tencent/Hunyuan-A13B-Instruct

Referensi API

Tentang Hunyuan-A13B-Instruct

Hunyuan-A13B-Instruct mengaktifkan hanya 13 B dari 80 B parameternya, namun sebanding dengan LLM yang jauh lebih besar pada tolok ukur arus utama. Ini menawarkan penalaran hibrida: mode “cepat” latensi rendah atau mode “lambat” presisi tinggi, dapat dialihkan per panggilan. Konteks 256 K-token asli memungkinkan untuk mencerna dokumen sepanjang buku tanpa degradasi. Keterampilan agen disesuaikan untuk kepemimpinan BFCL-v3, τ-Bench, dan C3-Bench, menjadikannya tulang punggung asisten otonom yang sangat baik. Grouped Query Attention plus kuantisasi multi-format memberikan inferensi yang ringan-memori, efisien-GPU untuk penerapan dunia nyata, dengan dukungan multibahasa bawaan dan penyelarasan keselamatan yang kuat untuk aplikasi kelas perusahaan.

Tersedia Serverless

Jalankan kueri segera, bayar hanya untuk penggunaan

Per 1M Token (Input/Output)

$

0.14

/ M Tokens

Per 1M Token (Input/Output)

$

0.57

/ M Tokens

Playground

Penggunaan API

Tolok ukur

Kasus Penggunaan

Loading...

Metadata

Buat di

30 Jun 2025

Lisensi

-

Penyedia

Tencent

HuggingFace

Hunyuan-A13B-Instruct

Spesifikasi

Negara

Available

Arsitektur

Mixture of Experts

Terkalibrasi

Ya

Campuran Ahli

Ya

Total Parameter

80B

Parameter yang Diaktifkan

13B

Penalaran

Tidak

Precision

FP8

Text panjang konteks

131K

Max Tokens

131K

Didukung Keberfungsian

Serverless

didukung

Serverless LoRA

Tidak didukung

Fine-tuning

Tidak didukung

Embeddings

Tidak didukung

Rerankers

Tidak didukung

Dukung Image Input

Tidak didukung

JSON Mode

didukung

Output Terstruktur

Tidak didukung

Alat

Tidak didukung

Fim Completion

Tidak didukung

Chat Prefix Completion

Tidak didukung

Bandingkan dengan Model Lain

Lihat bagaimana model ini dibandingkan dengan yang lain.

Tencent

chat

Hunyuan-MT-7B

Dirilis pada: 18 Sep 2025

Total Context:

33K

Max output:

33K

Input:

$

0.0

/ M Tokens

Output:

$

0.0

/ M Tokens

Tencent

chat

Hunyuan-A13B-Instruct

Dirilis pada: 30 Jun 2025

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.57

/ M Tokens

Tencent

chat

Hy3-preview

Dirilis pada: 7 Apr 2026

Total Context:

262K

Max output:

262K

Input:

$

0.066

/ M Tokens

Output:

$

0.26

/ M Tokens

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·

HALAMAN

MODEL

PRODUK

GPU yang Dipesan

© 2025 SiliconFlow

·