全球开源大模型杭州霸榜被终结Minimax开源大模型百万Token仅8元
开源模型王座再次易主,这次是国产模型Minimax M2。
在第三方评测平台Artificial Analysis最新榜单中,Minimax发布的M2模型直接登顶开源第一,打破了杭州双雄DeepSeek和Qwen长期霸榜的局面,仅次于Claude 4.5 Sonnet。
这次M2不只是强,还便宜。
- 速度:推理速度是Claude 3.5的2倍;
- 价格:API调用只要8%的成本,百万Tokens输入只需2块钱,输出8块出头;
- 能力:专为智能体Agent和编程打造,工具调用、复杂推理样样精通。
核心技术上,M2用了稀疏MoE架构,总参数230B,实际只激活10B,跑起来更快。如果配上Cerebras、Groq这类加速硬件,有望做到千Token每秒。
另一个亮点是“交错思维格式”设计,让它在多轮对话中能规划、验证操作步骤,适配复杂的Agent任务。
官方干脆直接开源了完整模型权重(MIT协议),Agent平台和API限时免费,官方原话:“免费到服务器扛不住为止”。
测试成绩方面:在MMLU Pro、GPQA Diamond等10个任务中,M2拿下总榜第5、开源第1。团队还对比了Claude、DeepSeek、GLM等模型,M2的Win+Tie比例全面占优。
而M2的定价是0.3美元/2.1人民币每百万输入Token,1.2美元/8.4人民币每百万输出Token,只要Claude 3.5 Sonnet的8%。
在线推理速度达每秒100Token,性价比极高。
同时,Minimax团队还针对智能体、全站开发和Terminal Use三项任务对M2和其他模型进行了一对一比拼,结果M2以高Win+Tie率胜出,成本却更低。
为了更直观地体现M2的Agent能力,Minimax已经把M2部署到了Agent平台,限时免费使用,按官方说法,免费期直到服务器扛不住为止。



