蚂蚁灵波开源世界模型LingBot-World
创始人
2026-01-29 11:47:20
0

AIPress.com.cn报道

1 月 29 日,蚂蚁集团旗下的灵波科技开源了名为 LingBot-World 的世界模型。这是继空间感知模型(LingBot-Depth)和 VLA 基座模型之后,蚂蚁在具身智能领域的第三次重磅发布。

官方宣称,该模型在视频质量、动态交互和长时一致性上,已经可以媲美谷歌的 Genie 3。这意味着,开发者现在拥有了一个免费、开源且高性能的“数字演练场”,无论是用来训练机器人、开发游戏,还是做自动驾驶模拟,都变得触手可及。

目前,LingBot-World在适用场景、生成时长、动态程度、分辨率等方面均处于业界顶尖水平。

视频生成领域有一个常见难题叫"长时漂移":生成时间一长,就可能出现物体变形、细节塌陷、主体消失或场景结构崩坏。LingBot-World通过多阶段训练和并行化加速,实现了近10分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。

在压力测试中,镜头最长移开60秒后返回,目标物体仍然存在且结构一致

交互性能方面,LingBot-World可实现约16 FPS的生成吞吐,端到端交互延迟控制在1秒以内。用户可以通过键盘或鼠标实时控制角色和相机视角,画面随指令即时反馈。

此外,用户可以通过文本触发环境变化和世界事件,比如调整天气、改变画面风格或生成特定事件,同时保持场景几何关系相对一致。

模型具备零样本泛化能力,仅需输入一张真实照片(如城市街景)或游戏截图,即可生成可交互的视频流,无需针对单一场景进行额外训练或数据采集。

为解决高质量交互数据匮乏的问题,LingBot-World采用混合采集策略:一方面清洗大规模网络视频覆盖多样化场景,另一方面结合游戏采集和虚幻引擎合成管线,从渲染层直接提取无UI干扰的画面,同步记录操作指令和相机位姿,为模型学习"动作如何改变环境"提供精确对齐的训练信号。

具身智能规模化落地面临的核心挑战是复杂长程任务的真机训练数据极度稀缺。LingBot-World凭借长时序一致性、实时交互响应,以及对"动作-环境变化"因果关系的理解,能够在数字世界中"想象"物理世界,为智能体提供低成本、高保真的试错空间。

模型还支持场景多样化生成(如光照、摆放位置变化),有助于提升具身智能算法在真实场景中的泛化能力。

目前LingBot-World模型权重和推理代码已面向社区开放。

相关内容

最新资讯

金晨被曝疑似涉嫌交通肇事逃逸 ... (来源:会拍摄的百晓生) 近日有知情人士爆料,2025年3月16日,金晨驾驶汽车在浙江省绍兴市柯桥区...
教育部叫停高一提前选科,政策意... 文汇报资料图 寒假即将开启,不少高一学子和家长手拿期末考试成绩,即将酝酿高考“小三门”的选考科目。在...
从“育分”到“育人”多地取消“... 点赞 收藏 分享 用手机看 从“育分”到“育人”多地取消“期末统考” 2026-01-27 09:...
美国大军逼近!美媒:伊朗拒绝就... 新华社1月28日消息,在美国大军向伊朗逼近之际,美国媒体28日报道说,美伊近期有过接触,但伊朗拒绝了...
日本最大核电站重启后发生故障初... △柏崎刈羽核电站(资料图) 当地时间1月29日,日本东京电力公司公布了关于柏崎刈羽核电站6号机重启后...
阿富汗教育部部长宣布永久禁止女... 2026年1月27日,阿富汗塔利班教育部正式发布公告,宣布在全国范围内无限期禁止女性接受正规教育,这...
孝昌县举办第三届“暖冬送岗 乐... 荆楚网(湖北日报网)讯(通讯员沈美艳)1月28日,孝昌县退役军人事务局联合县劳动就业服务中心、县关爱...
泰国一军用飞机坠毁 据新华社曼谷1月29日电 据泰国媒体29日报道,一架军用AT-6飞机在清迈坠毁,伤亡情况不明。 来...
探索大中衔接新机制,2025年... 近日,2025年度“中学生英才计划”物理学科年终评议在华南师范大学物理学院举行。来自省内的21名国家...
MiniMax发布Music ... AIPress.com.cn报道 1月29日消息,MiniMax正式发布新一代AI音乐生成模型 Mi...