“理想同学,开慢点”“前面左转”“停到前面的白车旁边”……2025年下半年VLA司机大模型上线后,众多理想车主分享智能语音交互日常,让新颖的语音控制成为出行常态。
数据显示,截至2025年底,该大模型月使用率达80%,指令使用次数达1225.4万次。从“能用”到“好用”再到“爱用”,源于VLA司机大模型在安全、效率与交互体验上的显著提升。作为理想汽车的核心技术名片,VLA司机大模型既是产品力的硬核基石,更是叩响高阶人工智能出行大门的一把钥匙。
用五年打造更贴心的智能出行助手
理想VLA司机大模型正式上车后,汽车的属性不再局限于交通工具的定位,辅助驾驶也摆脱了单纯模仿人类驾驶的模式,升级为可与用户高效沟通、深度理解意图的智能体,让车辆具备了听得懂、看得见、找得到的核心能力。从技术布局到落地,理想耗时五年,便完成了辅助驾驶技术的快速迭代。理想的来时路,正是中国汽车智能化发展的鲜活缩影。
智能化的实现主要靠工程师设计逻辑、编写程序,系统性能与研发人员的能力和经验密切相关,但现实路况具有高度复杂性和动态变化特征。
凭借对行业趋势的敏锐感知,理想汽车早早洞悉人工智能的发展机遇。早在2023年1月,理想汽车就在企业愿景中加入了“成为全球领先的人工智能企业”。同年6月,理想发布自研认知大模型Mind GPT。2024年10月,理想推送“端到端+VLM(视觉-语言模型)”功能,并部署至车端量产芯片。可以说,“All in AI”已成为理想汽车的重要战略,也是面对未来竞争的必然选择。
“端到端+VLM”架构是理想首次用AI的方式做辅助驾驶。“端到端+VLM”架构是用人类驾驶数据训练模型,数据数量和质量决定性能。在李想的AI TALK中,将早期人工时代的辅助驾驶类比为“昆虫动物智能”,在既定规则和条件下像蚂蚁那样行动和完成任务;而诞生于“AI时代”的“端到端+VLM”就完全不同,更像是“哺乳动物智能”,端到端阶段通过大模型学习人类驾驶行为。但这一技术也并非完美,还需提升其对突发场景的应对能力。
2025年人工智能行业迎来重要发展节点,年初Deep-Seek R1大模型上线,为国内多行业的智能化发展注入新的活力。2025年5月,理想发布自研VLA(视觉-语言-行为大模型)司机大模型。VLA将空间智能、语言智能和行为策略统一在一个模型里,可模拟任意视觉感知逻辑进行环境识别。此外,VLA构建了一体化智能决策体系,具备物理环境感知、语义理解与逻辑推理能力,可完成多场景下的复杂驾驶操作。
VLA作为驾驶辅助伙伴,通过用自然语言和理想同学交流,可以实现开快点、开慢点、左转、右转等辅助操作。还可以记忆用户的常用驾驶速度偏好,在符合道路法规与安全条件的前提下,适配用户习惯并提供辅助驾驶建议,提升驾乘舒适性。将车辆开到某一条路上的时候,车辆可以通过语言理解记住驾驶员的速度偏好和选择,并且以后都按照驾驶员的偏好执行。
VLA依然在高速迭代中。2025年8月,理想汽车随理想i8交付向用户正式推送了全球首个VLA司机大模型,并于9月向AD Max用户全量推送。12月6日,理想OTA推送升级后的8.1版本,强化绕行和变道能力,增加全场景车道级导航等功能。2026年开年,理想OTA推送8.2强化版VLA司机大模型,新版本在横纵向舒适体验上实现优化提升,进一步改善城区复杂路况下的驾乘体验。其中,横向控制影响驾乘稳定性,纵向控制影响驾乘平顺性,通过在训练模型中加入毫秒级方向盘和电门动作数据,让VLA司机大模型可在合规场景下输出更贴近人类驾驶行为的方向盘转角和电门开度,让辅助驾驶的横纵向控制更加舒适。
为什么是理想
理想汽车对AI领域的布局,展现出异乎寻常的执着。自2024年起,在李想的带领下,理想连续制作了两季“理想AI Talk”,以深度对话的方式介绍理想在AI领域的进展与思考,也展示了理想“All in AI”的决心。2026年初,李想再度表明了理想在AI投入上的坚定态度,“2026年是所有想要成为AI头部公司上车的最后一年。”理想在AI开发上展现出一种只争朝夕的紧迫感。凭借这份信念与魄力,辅以海量智力、资金投入,理想辅助驾驶技术在三年内实现阶梯式飞跃,VLA司机大模型的诞生亦成必然。
辅助驾驶领域百舸争流,VLA赛道高手云集。理想何以突围而出?有两点原因:一是锚定研发核心,沉心深耕技术理论,筑牢扎实功底;二是掌握数据、算法、算力、工程能力四大核心壁垒,将辅助驾驶研发的必备要素,转化为自身的独特竞争力。
受益于销量增长,截至2025年11月,理想已累计收集近15亿公里有效驾驶数据,保障了模型训练的场景多样性。这些数据从天气、时段、道路类型、接管类型等多个维度被分类分析。同时为了更好地应对更多突发状况,理想开始进一步使用生成数据进行训练,目前占比约10%,且这一比例将持续提升,这也是理想研发先进性的重要体现。生成数据源自虚拟世界模型,可模拟天气、时间变化并生成危险场景数据,实现训练场景均衡分布,覆盖极端小概率路况,助力VLA司机大模型安全性能升级。
算法上,理想利用世界模型开展仿真测试自动生成“真题”(完全复现某个场景)和“模拟题”(新的场景),不断给VLA提供高复杂度场景验证,在强力训练下,显著缩短测试周期,降低测试成本。算力上,截至2025年8月底,理想汽车总算力为13EFlops(每秒一百亿亿次浮点运算),其中3EFlops用于推理,10EFlops用于训练,拥有5万张训练和推理卡,算力处于行业领先地位。
工程落地能力同样是理想的长项,体现在量化精度高和跨平台部署能力强。2024年,理想汽车将VLM视觉语言大模型部署至Orin-X芯片;2025年,理想汽车在Thor-U芯片部署VLA模型,并实现VLA模型在Thor-U和Orin-X的跨平台部署。
扎实基本功的背后,是理想对核心技术不吝成本的投入。数据显示,近8年理想预计研发总费用近500亿元,研发费用位居新势力车企领先水平。2025年理想预计研发投入达到120亿元,其中人工智能领域投入达到60亿元。
VLA夯实具身智能基座
如此高成本打造VLA,理想的目标可不只是想做一套好用的辅助驾驶系统。
“未来,理想会进一步强化具身智能的品牌定位。”2026年伊始,理想在内部会议上再度提出了这一目标。当下,“具身智能”越来越多出现在车企的发展目标中,通俗来讲,指的是“能思考、能感知、能行动的智能系统,有实体载体(如人形机器人、机械臂、自动驾驶汽车等),能主动完成物理世界任务。”而李想则将具身智能产品分为两大品类:为高频使用的工具搭载感知、决策与执行模块,将工具改造为具身机器人;人形机器人。
从产品维度来看,VLA司机大模型未来将持续朝着高级辅助驾驶方向迭代研发,未来致力于实现更高级别的智能辅助驾驶体验,让车辆成为具备高阶智能交互能力的移动智能终端。升级后的智能座舱将打造具备空间感知与交互能力的智能体,进化后的充电站将提供自动化充电服务,AI眼镜将作为可穿戴智能交互设备服务用户。2025年12月,理想AI眼镜Livis正式发布。此外,据李想透露,理想正规划布局人形机器人相关研发。
车企为什么要跨界去布局机器人、飞行器、AI眼镜等产品?核心在于产品底层技术逻辑的相通,均离不开感知、思考、执行。感知相当于具身智能的环境交互模块,AI大模型相当于具身智能的决策中枢,操作系统相当于具身智能的调度体系,算力相当于具身智能的支撑平台,本体相当于具身智能的物理载体。而这一切的重要基础则是VLA司机大模型,以及其背后的基座模型、感知、芯片等软硬件,构成了研发具身智能的技术基座。
VLA这棵“大树”有着发达的“根系”支撑,这些“根系”未来也能为具身智能输送“养分”,目前,理想已经自研了星环OS操作系统、基座模型等技术底座。理想还计划在2026年交付搭载自研M100芯片的AI系统,这枚芯片并非仅为汽车设计,而是为了解决具身智能的端侧算力,具身智能要求超高的实时性和安全性,须在端侧解决感知和计算问题,因而离不开算力的芯片支持。
“电动车的选择不是不好,而是不够;智能终端的选择也不是不好,而是不够。”李想在内部反复强调,唯有选择“具身智能”这道最难的题,才能真正改变用户的生活。
向“具身智能企业”战略转型
从“创造移动的家”向“具身智能企业”的转变,代表了理想对未来发展的战略判断,这一转型也使理想汽车与特斯拉等企业处在了同一赛道。李想表示,同时布局基座模型、芯片、具身智能、操作系统等业务的公司,最终全球不会超过3家,理想汽车会努力成为其中一家。
为了适配新战略,理想汽车将对研发团队进行新一轮重组,按功能划分为基座模型团队、软件本体团队、硬件本体团队三大板块。其中,汽车、机器人等实体产品统一归入硬件本体团队,实现跨品类硬件资源整合。而更复杂的具身智能赛道需要理想有更加敏捷高效的感知和行动,因此,从2025年四季度开始,理想坚定地回到创业公司的管理模式,以创业的活力来面对新阶段、新技术的挑战。
“超越用户需求”始终是理想坚持的核心价值观,从选择无顾虑的增程技术路径,到开创“冰箱、彩电、沙发”的多元空间体验,再到构建高效超充补能体系,理想在电动车领域持续探索创新。当汽车的未来图景越发清晰,如何才能满足用户更高阶的需求?在理想的答案中,突破电动车单一维度,以具身智能矩阵给用户带去新的惊喜,满足用户更大的需求,这是一条更宽也更长的赛道。五年深耕之下,VLA大模型成为理想布局新赛道的关键技术支撑。以Livis AI眼镜为起点,理想即将迈入全新产品爆发期,一个更高维、更智能的品牌新形态,正款款而来。文/刘斌