小米发布并开源Xiaomi OneVL自动驾驶模型
创始人
2026-05-13 23:57:33
0

IT之家 5 月 13 日消息,小米技术今日正式发布并开源 Xiaomi OneVL 一步式潜空间语言视觉推理框架。

官方表示,该模型在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一,在具备 XLA 模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案,在精度上超越显式 CoT、在速度上对齐“仅答案”预测的潜空间 CoT 方案。

过去,VLA 和世界模型是自动驾驶领域两条相对独立的技术路线:VLA 专注于理解场景并输出驾驶动作,世界模型专注于预测未来场景的演变。Xiaomi OneVL 通过潜空间推理,首次将两者统一到同一套框架中。

在涵盖感知、推理与规划的多个主流基准上,Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。

▲ 在 ROADWork、Impromptu、Alpamayo-R1 三项基准上均达到 SOTA,在 NAVSIM 上取得优越性能

同时,Xiaomi OneVL 能为模型决策提供语言和视觉双维度的可解释性 —— 既能用文字说明“为什么这样开”,也能用预测画面展示“接下来会发生什么”。

▲ 为模型决策提供语言以及视觉的可解释性

小米已将Xiaomi OneVL 的模型权重和训练、推理代码全面开源,IT之家汇总链接如下:

  • 技术报告:https://arxiv.org/abs/2604.18486
  • 项目主页:https://Xiaomi-Embodied-Intelligence.github.io/OneVL
  • 开源代码:https://github.com/xiaomi-research/onevl

相关内容

最新资讯

支付宝“AI收”上线新能力 5月13日,支付宝“AI收”发布新能力,联合AI开发平台扣子编程升级“支付宝支付集成Skill”,并...
2026年手机系统AI功能深度... 在2026年的今天,AI早已不再是系统的“加分项”,而是决定用户体验好坏的核心能力。用户在选择手机时...
Voi联合创始人的AI新创公司... 瑞典初创公司Pit近来因一些颇具争议的社交媒体帖子引发关注,但它同时也凭借自身实力,成为斯德哥尔摩又...
论道AI影视 智能影像时代AI... 中新网北京5月13日电 (记者 高凯)5月13日,作为由中国广播电视社会组织联合会、中共北京市委宣传...
光环新网涨7.04%,开源证券... 今日光环新网(300383)涨7.04%,收盘报17.8元。 2026年4月30日,开源证券研究员蒋...
小米发布并开源Xiaomi O... IT之家 5 月 13 日消息,小米技术今日正式发布并开源 Xiaomi OneVL 一步式潜空间语...
2026年手机系统AI功能横评... 随着AI技术全面融入智能手机,一个系统的“聪明”程度已经成为用户体验的核心竞争力。面对“哪个手机系统...
莫斯科大学教育国际化路径与启示 在全球化背景下,教育国际化已成为各国提升国家竞争力、增强文化影响力的重要战略选择。莫斯科大学作为俄罗...
广东省2026年普通专升本志愿... 1.我省2026年普通专升本在什么时间填报志愿,在哪里填报? 答:普通专升本实行网上填报志愿。5月1...
博士肄业生把985院长拉下马:... 说出来谁敢相信?能把985院长拉下马的人,既不是“钓鱼执法”的学术妲己,也不是学术地位多高的学者,而...