關於step3
Step3 是從 StepFun 開發的一個尖端多模態推理模型。它建立在一個專家混合(MoE)架構上,總參數為 321B,活動參數為 38B。該模型被設計成端到端以在提供高級性能的同時最小化解碼成本。通過多矩陣因子化注意(MFA)和注意-FFN 分解(AFD)協同設計,Step3 在旗艦和低端加速器上均保持卓越的效率。在預訓練期間,Step3 處理了超過 20T 的文本標記和 4T 的圖像文本混合標記,涵蓋了十多種語言。該模型在開源模型的各種基準測試中,包括數學、代碼和多模態性,已達到了先進的性能。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.57
/
$
1.42
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
可用
架構
經過校準的
不
專家並行
是
總參數
321B
啟用的參數
38B
推理
不
精度
FP8
上下文長度
66K
最大輸出長度
66K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
支持
JSON 模式
支持
結構化輸出
不支持
工具
支持
中間填充補全
不支持
聊天前綴補全
不支持
與其他模型比較
看看這個模型與其他模型的對比如何。

