关于gpt-oss-120b
gpt-oss 系列是 OpenAI 的开源模型,旨在用于强大的推理、代理任务和多功能的开发者使用案例。gpt-oss-120b 用于生产、通用、高推理使用案例,这些使用案例适合单个 80GB GPU(如 NVIDIA H100 或 AMD MI300X)。
可用的 Serverless
立即运行查询,仅按使用量付费
$
0.05
/
$
0.45
每 100 万 token(Input/Output)
元数据
规格
州
Available
建筑
校准的
是
专家混合
是
总参数
120B
激活的参数
5.1B
推理
不
精度
FP8
上下文长度
131K
最大输出长度
8K
支持功能
Serverless
支持
Serverless LoRA
不支持
微调
不支持
Embeddings
不支持
Rerankers
不支持
支持 Image Input
不支持
JSON Mode
支持
结构化Outputs
不支持
工具
不支持
FIM 补全
不支持
对话前缀补全
不支持
