關於MiniMax-M1-80k
MiniMax-M1 是一個開放權重,大規模混合注意力推理模型,具有 456 B 個參數和每個 token 激活 45.9 B。它本地支持 1 M-token 上下文,閃電注意力實現了比 DeepSeek R1 在 100 K tokens 下節省 75% FLOPs,並利用 MoE 架構。使用 CISPO 和混合設計的高效 RL 訓練在長輸入推理和真實世界軟體工程任務上達到最先進的性能。
可用的無伺服器
立即運行查詢,僅按使用量付費
$
0.55
/
$
2.2
每百萬 Tokens(輸入/輸出)
元數據
規格
狀態
Available
架構
經過校準的
是
專家並行
是
總參數
456B
啟用的參數
45.9B
推理
否
精度
FP8
上下文長度
131K
最大輸出長度
131K
支援的功能
無伺服器
支持
無伺服器的 LoRA
不支持
微調
不支持
向量嵌入
不支持
重排序
不支持
支援圖片輸入
不支持
JSON 模式
不支持
結構化輸出
不支持
工具
不支持
中間填充補全
不支持
聊天前綴補全
不支持
與其他模型比較
看看這個模型與其他模型的對比如何。

