約Hy3-preview
Hy3 preview is a 295B-parameter Mixture-of-Experts (MoE) language model from Tencent Hunyuan, built for production-grade agent workloads. With only 21B parameters activated per token and native 256K context support, it handles complex tasks like cross-file code refactoring, long-document analysis, and multi-step tool use, rather than just generating fluent dialogue. Hy3 scores near state-of-the-art on SWE-bench Verified and advanced STEM benchmarks, while offering three inference modes (no_think, think_low, think_high) to dynamically trade off latency and reasoning depth. Its sparse activation architecture delivers competitive intelligence at a significantly lower token cost.
利用可能な Serverless
クエリをすぐに実行し、使用量のみを支払います
100万トークン(Input/Output)ごとに
$
0.0
/ M Tokens
100万トークン(Input/Output)ごとに
$
0.0
/ M Tokens
メタデータ
仕様
州
Available
建築
Mixture-of-Experts
キャリブレートされた
いいえ
専門家の混合
はい
合計パラメータ
80B
アクティブ化されたパラメータ
21B
推論
いいえ
Precision
FP8
コンテキスト長
131K
Max Tokens
262K
対応機能
Serverless
対応
Serverless LoRA
サポートされていません
Fine-tuning
サポートされていません
Embeddings
サポートされていません
Rerankers
サポートされていません
Image入力をサポートする
サポートされていません
JSON Mode
サポートされていません
構造化されたOutputs
サポートされていません
ツール
対応
Fim Completion
サポートされていません
Chat Prefix Completion
対応
他のModelsと比較
他のモデルに対してこのModelがどのように比較されるかを見てください。

Tencent
chat
Hy3-preview
リリース日:2026/04/07
Total Context:
131K
Max output:
262K
Input:
$
0.0
/ M Tokens
Output:
$
0.0
/ M Tokens

Tencent
chat
Hunyuan-MT-7B
リリース日:2025/09/18
Total Context:
33K
Max output:
33K
Input:
$
/ M Tokens
Output:
$
/ M Tokens

Tencent
chat
Hunyuan-A13B-Instruct
リリース日:2025/06/30
Total Context:
131K
Max output:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens
