模型

產品

定價

文檔

部落格

關於

聯繫

🎉 Kimi-K3可在 SiliconFlow 上使用。現在就試試看。

🎉 Kimi-K3可在 SiliconFlow 上使用。現在就試試看。

模型

Hunyuan-A13B-Instruct

Hunyuan-A13B-Instruct

tencent/Hunyuan-A13B-Instruct

API 參考

關於Hunyuan-A13B-Instruct

Hunyuan-A13B-Instruct 僅啟用其 80 B 參數中的 13 B，卻能在主流基準上匹敵更大的 LLMs。它提供混合推理：每次呼叫可切換為低延遲“快速”模式或高精度“慢速”模式。內建 256 K-token 上下文，允許它在不減低功效的情況下解析書籍長度的文件。代理技能為 BFCL-v3、τ-Bench 和 C3-Bench 領導力而調校，使其成為優秀的自主助手基礎。分組查詢注意力和多格式量化提供記憶體輕量、GPU 高效的推理，適合現實世界的部署，並具備內建多語言支持和堅固的安全對齊，適用於企業級應用。

可用的無伺服器

立即運行查詢，僅按使用量付費

每百萬 Tokens（輸入/輸出）

$

0.14

/ M Tokens

每百萬 Tokens（輸入/輸出）

$

0.57

/ M Tokens

體驗中心

API 使用

基準

用例

Loading...

元數據

創建於

2025年6月30日

許可證

-

供應商

Tencent

HuggingFace

Hunyuan-A13B-Instruct

規格

狀態

Available

架構

Mixture of Experts

經過校準的

是

專家並行

是

總參數

80B

啟用的參數

13B

推理

否

精度

FP8

上下文長度

131K

最大輸出長度

131K

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

不支持

JSON 模式

支持

結構化輸出

不支持

工具

不支持

中間填充補全

不支持

聊天前綴補全

不支持

與其他模型比較

看看這個模型與其他模型的對比如何。

Tencent

chat

Hunyuan-MT-7B

發行日期：2025年9月18日

總上下文：

33K

最大輸出：

33K

輸入：

$

0.0

/ M Tokens

輸出：

$

0.0

/ M Tokens

Tencent

chat

Hunyuan-A13B-Instruct

發行日期：2025年6月30日

總上下文：

131K

最大輸出：

131K

輸入：

$

0.14

/ M Tokens

輸出：

$

0.57

/ M Tokens

Tencent

chat

Hy3

發行日期：2026年6月26日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.132

/ M Tokens

輸出：

$

0.528

/ M Tokens

Tencent

chat

Hy3-preview

發行日期：2026年4月7日

總上下文：

262K

最大輸出：

262K

輸入：

$

0.066

/ M Tokens

輸出：

$

0.26

/ M Tokens

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·

頁面

模型

大型語言模型

產品

© 2025 SiliconFlow

·