6月17日快讯,Minimax正式开源其推理模型M1。该模型创新性地采用融合Lightning Attention机制的混合注意力架构,在参数配置上实现了行业突破:单次推理可处理目前行业内支持的最大规模——百万级token上下文输入(达1,000,000 token),并可生成长达80,000 token的输出结果。在计算效率层面,当进行8万token深度推理时,仅需DeepSeek R1约30%的算力需求。研发团队透露,在强化学习训练阶段仅投入512块NVIDIA H800 GPU运行三周即完成模型迭代,期间产生的GPU租赁成本总计53.74万美元。(广角观察)
MiniMax开源首个推理模型M1
📝版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
📌文章名称:《MiniMax开源首个推理模型M1》
📌文章链接:https://www.fsgameo.com/breaking-news/8595.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
📌文章名称:《MiniMax开源首个推理模型M1》
📌文章链接:https://www.fsgameo.com/breaking-news/8595.html
⚠须知:本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。