Hunyuan-A13B-Instruct
Tentang Hunyuan-A13B-Instruct
Hunyuan-A13B-Instruct mengaktifkan hanya 13 B dari 80 B parameternya, namun sebanding dengan LLM yang jauh lebih besar pada tolok ukur arus utama. Ini menawarkan penalaran hibrida: mode “cepat” latensi rendah atau mode “lambat” presisi tinggi, dapat dialihkan per panggilan. Konteks 256 K-token asli memungkinkan untuk mencerna dokumen sepanjang buku tanpa degradasi. Keterampilan agen disesuaikan untuk kepemimpinan BFCL-v3, τ-Bench, dan C3-Bench, menjadikannya tulang punggung asisten otonom yang sangat baik. Grouped Query Attention plus kuantisasi multi-format memberikan inferensi yang ringan-memori, efisien-GPU untuk penerapan dunia nyata, dengan dukungan multibahasa bawaan dan penyelarasan keselamatan yang kuat untuk aplikasi kelas perusahaan.
Tersedia Serverless
Jalankan kueri segera, bayar hanya untuk penggunaan
$
0.14
/
$
0.57
Per 1M Token (Input/Output)
Metadata
Spesifikasi
Negara
Available
Arsitektur
Terkalibrasi
Ya
Campuran Ahli
Ya
Total Parameter
80B
Parameter yang Diaktifkan
13B
Penalaran
Tidak
Precision
FP8
Text panjang konteks
131K
Max Tokens
131K
Didukung Keberfungsian
Serverless
didukung
Serverless LoRA
Tidak didukung
Fine-tuning
Tidak didukung
Embeddings
Tidak didukung
Rerankers
Tidak didukung
Dukung Image Input
Tidak didukung
JSON Mode
didukung
Output Terstruktur
Tidak didukung
Alat
Tidak didukung
Fim Completion
Tidak didukung
Chat Prefix Completion
Tidak didukung
Bandingkan dengan Model Lain
Lihat bagaimana model ini dibandingkan dengan yang lain.

