MiniMax M3大模型开源:百万级上下文能力亮眼,综合实力位居全球开源模型前列
创始人
2026-06-20 18:25:10
0

【太平洋科技快讯】6月1日,稀宇科技发布了新一代AI大模型MiniMax M3(详情可查看此前太平洋科技的报道内容:)。上周五,稀宇科技开源了MiniMax M3模型权重,同步发布了MSA(MiniMax Sparse Attention)技术论文,详细公开该架构的设计思路与工程落地方案。依托MSA技术,M3在处理超长上下文内容时,计算开销得到显著优化。

MiniMax M3为原生多模态大模型,整体总参数量达428B,实际激活参数量为23B。该模型从训练初始阶段便开展多模态混合训练,通过文本、图像等多类型数据交错学习,在预训练环节完成不同模态语义的深度融合,搭建起统一的跨模态语义体系,为多模态理解、内容生成以及复杂任务处理打下底层基础,也是业内首款从零起步完成多模态混合训练的开源模型。

MiniMax M3在研发阶段便明确方向,兼顾推理能力、长文本处理、多模态表现,同时降低使用门槛,面向个人开发者与企业实现普惠应用。

上线两周时间里,MiniMax M3在Artificial Analysis综合智能指数榜单中,位列全球开源模型首位,收获了全球开发者、科研人员与行业用户的广泛测试与反馈。

面对开源后访问量激增的情况,官方持续进行性能调优。目前模型输出速度已从初始30TPS提升至80TPS,后续还计划将速度再提升30%至40%,进一步改善使用体验。同时平台上线调用数据看板,方便用户实时查看使用额度,统筹使用成本。

结合反馈来看,用户普遍关注模型服务稳定性、高负载下持续运行能力以及规模化部署成本。当下大模型深度融入各类生产场景,智能体可长时间执行复杂长周期任务,Token消耗随之攀升,业内也愈发注重模型性能、使用成本与运行稳定性的平衡。

相关内容

最新资讯

【统战动态】暖心伴考传佳音 职... 每年五六月份中考来临,不少考生与家长因不熟悉职业技工教育培养模式、院校布局、升学就业相关政策,在志愿...
胡锡进谈纸尿裤事件:山东省乃至... 市场上几大纸尿裤品牌是否含有危害婴幼儿健康的毒性物质?《经济参考报》与相关品牌和多家机构对峙,事情变...
同样是蓉城双子星:一位崛起成最... 在成都的足球场上,两个年轻球员的命运正在上演一出鲜明的对比。一边是胡荷韬,这位年轻后卫被誉为半个赛季...
最强可达超强台风级!今年第7号... @中央气象台 发布消息,今年第7号台风“米克拉”(英文名称:Mekkhala;名字来源:泰国;名称意...
“欧洲要好好学习,别总想着打赢... 【文/观察者网 陈思佳】“欧洲汽车产量正在减少,多数新车中国制造。”据美国彭博社6月19日报道,随着...
AI有用|找兼职遇上AI,灵活... 人民网记者 马作鹏 在上海,灵活就业已成为超过千万劳动者实现就业、平衡家庭与职业发展的重要路径。 张...
2026国际出版企业高层论坛举... 6月19日,由中国出版协会、国际出版商协会共同主办的2026国际出版企业高层论坛在京举行。来自26个...
腾讯客服:微信正在灰度测试 A... 新京报贝壳财经讯(记者韦英姿)6月20日,新京报贝壳财经记者咨询腾讯客服后获悉,微信小微(智能助手)...