猿力部落——汽车人的技术社区
据AutoTech News报道,英伟达在NeurIPS大会上发布了其先进的AI工具,在自动驾驶领域取得了又一次重大突破。此次发布的核心是英伟达DRIVE Alpamayo-R1,这是全球首个专为移动出行领域量身打造的开放式工业级推理视觉-语言-动作(VLA)模型。该模型旨在提升自动驾驶车辆的安全性和性能,从而助力实现L4级自动驾驶。
隆重推出DRIVE Alpamayo-R1:自动驾驶领域的变革者
英伟达DRIVE Alpamayo-R1 (AR1)将逻辑推理人工智能与路径规划相结合,这是确保自动驾驶汽车能够像人类一样理解复杂环境的关键组件。以往的自动驾驶模型在行人密集的十字路口或绕过违章停车等障碍物时常常表现不佳。然而,AR1旨在通过运用先进的推理能力来克服这些挑战。
AR1通过对场景进行逐步分解,评估潜在轨迹和上下文数据,从而确定最佳路线。例如,如果自动驾驶车辆遇到繁忙的自行车道,它可以分析周围环境并利用推理轨迹来规划下一步行动,例如驶离车道或为行人停车。这项功能标志着在打造更安全、更可靠的自动驾驶体验方面取得了重大进展。
开放基础架构和研究合作
AR1的一大亮点在于其开放的基础架构,该架构基于英伟达Cosmos Reason框架构建。这种开放性使得研究人员能够根据其特定的非商业项目定制AR1,从而促进自动驾驶领域的进一步创新。英伟达已将该模型发布在GitHub和Hugging Face等平台上,并通过英伟达Physical AI Open Datasets提供了一部分训练数据。
此外,训练后强化学习也展现出令人鼓舞的成果,表明AR1的推理能力相比预训练模型有了显著提升。这鼓励了研究人员利用该模型进行广泛的测试和实验,从而营造一个有利于未来发展的合作环境。
利用Cosmos Cookbook加强开发者生态系统
为配合AR1的发布,英伟达还推出了Cosmos Cookbook,这是一份面向开发者的必备资源。这本内容全面的指南提供了模型定制、数据整理、合成数据生成和评估的分步说明。
Cosmos旗下近期推出的一系列工具和模型包括:
· LidarGen:全球首个能够为自动驾驶汽车仿真生成激光雷达数据的模型。
· Omniverse NuRec Fixer:一种旨在纠正神经重建数据中的伪影以提高模拟精度的模型。
· Cosmos Policy:一个将大型预训练视频模型转换为可靠的机器人行为的框架。
· ProtoMotions3:一个用于在逼真的物理环境中训练数字人和人形机器人的开源框架。
这些创新凸显了英伟达致力于推进“物理人工智能”领域的决心,物理人工智能被定义为能够在物理世界中进行推理、感知和行动的系统。
未来方向:人工智能与自主性的新时代
随着英伟达在物理人工智能领域的投入不断加深,其目光投向了变革机器人和自动驾驶汽车领域的方向。首席执行官黄仁勋强调了打造能够在现实世界中独立运行的智能系统的重要性。随着云端人工智能与物理应用之间的界限日渐模糊,英伟达正逐步成为未来自主机器“大脑”研发领域的先驱。