關於gpt-oss-120b
gpt-oss 系列是 OpenAI 的開源權重模型,旨在進行強大的推理、代理任務和多用途開發者使用案例。gpt-oss-120b 適用於生產、通用、高推理使用案例,符合單一 80GB GPU(如 NVIDIA H100 或 AMD MI300X)的需求。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.05
/
$
0.45
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
Available
架構
經過校準的
是
專家並行
是
總參數
120B
啟用的參數
5.1B
推理
否
精度
FP8
上下文長度
131K
最大輸出長度
8K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
支持
結構化輸出
不支持
工具
不支持
中間填充補全
不支持
聊天前綴補全
不支持
