關於Hunyuan-A13B-Instruct
Hunyuan-A13B-Instruct 僅啟用其 80 B 參數中的 13 B,卻能在主流基準上匹敵更大的 LLMs。它提供混合推理:每次呼叫可切換為低延遲“快速”模式或高精度“慢速”模式。內建 256 K-token 上下文,允許它在不減低功效的情況下解析書籍長度的文件。代理技能為 BFCL-v3、τ-Bench 和 C3-Bench 領導力而調校,使其成為優秀的自主助手基礎。分組查詢注意力和多格式量化提供記憶體輕量、GPU 高效的推理,適合現實世界的部署,並具備內建多語言支持和堅固的安全對齊,適用於企業級應用。
可用的無伺服器
立即運行查詢,僅按使用量付費
每百萬 Tokens(輸入/輸出)
$
0.14
/ M Tokens
每百萬 Tokens(輸入/輸出)
$
0.57
/ M Tokens
元數據
規格
狀態
Available
架構
Mixture of Experts
經過校準的
是
專家並行
是
總參數
80B
啟用的參數
13B
推理
否
精度
FP8
上下文長度
131K
最大輸出長度
131K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
支持
結構化輸出
不支持
工具
不支持
中間填充補全
不支持
聊天前綴補全
不支持
與其他模型比較
看看這個模型與其他模型的對比如何。

