關於MiniMax-M2
MiniMax-M2 為代理重新定義了效率。它是一個緊湊、快速且具成本效益的 MoE 模型(2300 億個總參數,其中 100 億個活動參數)專為在編程和代理任務中實現精英性能而建造,同時保持強大的通用智能。僅使用 100 億個激活參數,MiniMax-M2 提供當今領先模型預期的高級端到端工具使用性能,但在一種簡化的外形中,使部署和擴展比以往更容易。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.3
/
$
1.2
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
可用
架構
經過校準的
不
專家並行
是
總參數
230B
啟用的參數
10B
推理
不
精度
FP8
上下文長度
197K
最大輸出長度
131K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
支持
結構化輸出
不支持
工具
支持
中間填充補全
不支持
聊天前綴補全
支持

