LOADING STUFF...

4560亿参数+100万上下文！MiniMax-M1重新定义开源模型天花板

AI快讯5个月前更新 hackchen

17 0 420

4560亿参数+100万上下文！MiniMax-M1重新定义开源模型天花板

MiniMax于2025年6月17日正式开源了其革命性的MiniMax-M1模型，这款被誉为"全球首个开源大规模混合架构推理模型"的产品在多个方面刷新了行业标准。

核心技术突破

MiniMax-M1采用了创新的混合架构设计：

混合专家模型(MoE)与LightningAttention机制相结合
模型总参数量达到4560亿(456B)
单token激活参数为45.9B
原生支持1,000,000(1M)token的超长上下文输入
支持最高80,000token的输出长度

性能与成本优势

M1在多个关键指标上表现出色：

强化学习成本：仅53.74万美元(使用512块H800 GPU训练三周)
推理效率：8万token深度推理时仅需DeepSeek R1约30%的算力
长文本处理：上下文窗口是DeepSeek R1的8倍
工具使用能力：在TAU-bench测试中领先所有开源权重模型

4560亿参数+100万上下文！MiniMax-M1重新定义开源模型天花板

商业应用价值

MiniMax-M1采用Apache 2.0许可证，企业可以：

无限制地用于商业应用
自由修改模型
无需支付授权费用

API服务方面，MiniMax也提供了具有竞争力的性价比，具体定价可参考其官方渠道。

行业影响

M1的发布标志着大模型技术进入"长上下文、低成本、高推理"的新阶段，其混合架构和高效训练方法(如CISPO算法)展示了通过技术创新突破"算力-资本"壁垒的可能性。在AIME2024测试集上，这一技术路线表现出色，收敛速度比传统方法快3-5倍。

开发者可通过以下渠道获取模型：

GitHub: https://github.com/MiniMax-AI/MiniMax-M1
Hugging Face: https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094
体验地址: https://chat.minimax.io/

© 版权声明

文章收集自互联网，如有侵权，请联系删除

相关文章

AMD Amuse 3.1 如何撕开 AI 创作垄断？

hackchen

157 540

iOS 26塞进GPT-5：苹果让手机变“超级大脑”，但70%的人怕它偷数据！

hackchen

10 360

夸克”深度研究”上线：AI一键生成学术报告，科研效率提升300%

hackchen

150 540

提升AI指令跟随能力：Meeseeks实战指南

hackchen

20 600

年化 40 亿！暴涨 4 倍的 Anthropic，与 Cursor 打响 AI 生死战

hackchen

36 360

Qwen3震撼发布：解锁大语言模型新纪元，引领智能未来！

hackchen

32 240

AI工具库导航，收集各种好玩的AI工具和资讯

Copyright © 2025 AI工具库