浪潮源Yuan3.0 Ultra多模态基础大模型开源发布
创始人
2026-03-06 11:18:46
0

IT之家 3 月 6 日消息,浪潮旗下 YuanLab.ai团队今日开源发布源 Yuan3.0 Ultra 多模态基础大模型,这是一款面向万亿参数规模打造的旗舰模型。

Yuan3.0 Ultra 将 MoE 大模型的训练效率优化系统性引入模型结构设计之中,并围绕企业应用及智能体工具调用等方面开展了深度优化,在多模态文档理解、检索增强生成(RAG)、表格数据分析、内容摘要与工具调用等企业级任务中表现突出。

这些能力使源 Yuan 大模型能够处理企业环境中的复杂信息形态,如图文混排文档、多级结构表格以及跨文档知识检索,为基于 OpenClaw 等智能体框架构建多模态数据驱动的企业 Agent AI 提供能力支撑。

Yuan3.0 Ultra 采用统一多模态模型架构,由视觉编码器、语言主干网络与多模态对齐模块组成,实现视觉与语言信息的协同建模。其中,语言主干网络基于混合专家(MoE)架构构建,包含 103 层 Transformer,训练初始阶段参数规模 1515B,通过 LAEP 方法创新,团队在预训练过程中将模型参数优化至 1010B,预训练算力效率提升 49%。

Yuan3.0 Ultra 的激活参数为 68.8B。此外,模型还引入了 Localized Filtering Attention(LFA)机制,强化对语义关系的建模能力,相比经典 Attention 结构可获得更高的模型精度表现。

Yuan3.0 Ultra 大模型全面开源,不仅包括模型权重(16bit 与 4bit 模型)、技术报告,也涵盖完整的训练方法与评测结果,支持社区在此基础上进行二次训练与行业定制。

源 Yuan3.0 基础大模型将包含 Flash、Pro 和 Ultra 等版本,模型参数量为 40B、200B 和 1T 等,相关成果将陆续发布。IT之家附 Yuan3.0 Ultra 开源地址如下:

相关内容

最新资讯

2026年上海留学中介十强解析... 一、如何在众多选择中定位合适的上海留学机构? 当学生面临留学机构选择时,常陷入信息过载的困境。从业...
暴躁鸭雅思老师Carol:小晨... 她一月底入学,那时对雅思内容还没多少概念,在发送完雅思考试的内容介绍,仔细讲解完其中的关键考点后,我...
探索校企协同培养博士后新模式 □ 陈 琨 中国博士后制度是由著名物理学家、诺贝尔奖获得者李政道教授提议,邓小平同志亲自决策,经国务...
关于中职教师资格证还不了解的看... 关于中职教师资格证还不了解的看过来!一条视频给大家讲清楚大学生 教师资格证
新学期新风貌丨春秋假要来了?校... 春寒未退,热情已满!3月4日,全县各中小学校如期开学,学子们带着对新学期的憧憬有序返校。沉寂了一个寒...
中国航司重启中东航线,首架航班... ▲杨先生所乘航班顺利抵达利雅得 视频截图当地时间3月5日19时42分,国航北京—利雅得CA789航班...
致全县幼儿园幼儿家长的一封信 尊敬的家长: 您好!感谢您一直以来对费县学前教育事业的关心和支持。新学期伊始,为切实保障每一位幼儿家...
取消优惠政策,减少文科计划,2... 浙江工业大学2026年“三位一体”综合评价招生章程在保持总计500名不变的基础上,围绕专业组设置、报...
楚雄州组织开展普通高中命题专题... 为深入贯彻落实《教育部办公厅关于进一步加强中小学日常考试管理的通知》精神,全面规范全州普通高中考试命...
郑州幼儿师范高等专科学校举行实... 3月5日上午,郑州幼儿师范高等专科学校与郑州市非遗保护和文旅文创融合发展中心在象湖校区举行实践教学基...