在社交媒体上,有很多用户分享理想汽车“任务大师”功能的任务码,甚至理想汽车官方账号也给出了一些热门功能的分享。
但在评论区,依然众口难调。
事实上,且不说有多少用户真的会自己创建和使用“任务大师”功能,对于每一项功能,不同用户的使用习惯与场景,其实也都有所差异。
但在理想L9 Livis上,你可以只说一句“二排小朋友困了,帮我哄睡他”,车就可以自动切换背景音乐、调暗氛围灯、关闭遮阳帘,甚至配合主动悬架像婴儿床一样摇动车身。
这背后,就是规则驱动与智能体的本质区别。
不久之前,理想汽车举办的一场小范围股东大会上,有人质疑理想的具身智能叙事无法让用户感知,也有人说为什么能让用户快速感知的内饰设计就是不改?
6月15日,李想与他的团队用软件与具身智能发布会,完整地回答了这些问题。
01
理想汽车的豪华是什么?
VERTU手机代表的是一种高端,但没有人会否认iPhone更加伟大。因为豪华不仅是由皮革、木材与缝线定义的,也存在于设计的细节与某一刻的会心一笑。
此前李想在回应用户对于设计风格的质疑时曾经说过:当座舱大屏放在那里的时候,不管怎样设计,看上去都是差不多的,因为屏幕是最显眼的。
这是智能汽车时代的必然,它决定了汽车内饰的设计不会像90年代那样“百花齐放”,同时也为豪华、舒适的体验带来了新的呈现方式。
而在理想汽车上,你会发现设计是一套完整的叙事逻辑,它有着独特的思考,并且为整个功能体系服务,而并非当下流行什么,设计师就加上什么。
就像L9 Livis上那条被去掉的屏幕分割线,它并不是为了炫耀自己有一个更大的屏幕,而是一个可以平衡单人出行、副驾同行不同场景下屏幕使用需求的最佳方案。而每一个开关动态的设计、圆角的比例,都是精心设计的结果,甚至屏幕上光影的效果也会随着唤醒人的位置、氛围灯的设定联动。
如果说,“老钱”时代的豪华是木纹、皮革所营造的视觉效果,那么在智能时代,如何在屏幕中呈现豪华,可能理想汽车的设计就是答案。
更重要的是,这种豪华的体验是“鲜活”的。
当你在泊车时,关键信息会自动放大,从而给你提供充分的环境感知信息,带来足够的安全感;而当你走在每天经过的熟悉路段时,也可以隐藏掉所有内容,仅仅保留一个空旷、流动的光影效果。
一旦副驾上车,娱乐信息面板会自然出现,但依然把更大面积留给主驾,而当他点开视频的时候,屏幕会1:1平分,到了停车看电影时,整个大屏又可以变成沉浸式宽幅电影幕布。
从设计到交互,屏幕有机地融合到了内饰当中,代表着内饰设计的品位,以及智能豪华的体验。
02
具身智能汽车是什么?
李想为具身智能汽车给出的定义,是一个电动车+一位职业司机+一台AI计算机+一个生活助手,其中电动车和AI计算机负责“具身”,职业司机与生活助手负责“智能”。
李想直言:“如今的智能手机和智能汽车,它们本质上还是功能驱动的,而不是一个有生命力的智能体。”
如果说过去在汽车行业,大多数“AI上车”所描述的还是如豆包、ChatGPT一样的对话工具,能够更好地理解用户所说,或是玩一玩成语接龙的游戏。那么在理想L9 Livis上,AI成为了可以像Codex、Claude Code一样可以完成任务的工具。
这将真正改变用户的体验。
比如在发布会上所演示的场景:你需要去机场接朋友,然后根据他的饮食偏好寻找一个洗尘宴餐厅。
通常来说,我们可能要通过航旅纵横App查询航班时刻,然后用大众点评查找餐厅,最后再将机场、餐厅分别作为途经点输入到车机地图。
但在理想L9 Livis上,你只需告诉理想同学:我有个朋友要来北京,他的航班号是CA1314,然后他是一个素食主义者,你先去接他,然后去望京找个餐厅吃洗尘宴,规划一下路线。
车机就会直接帮你查询到航班时刻,然后查找餐厅,并且一并完成线路规划。
而当电动车与职业司机结合在一起时,它可以在你前往理想超充站后,自动进行排队、配合站端的充电机器人完成自动充电,甚至充电完成后还可以自动驶离停到旁边的空闲车位。
在停车场里,它也可以在用户离车后自动寻找车位、自动停车,甚至在这个过程中能够告诉穿行的行人先走,或是理解保安的语言、手势指挥。
李想说:“有没有一种感觉?虽然他长得还像一辆汽车,但似乎他已经慢慢的拥有了生命,充满了人味。”
03
如何构建具身智能大脑?
本质上,具身智能对于汽车而言,就是通过具身智能打造一辆能够保护人类安全、独立完成任务、比人类更高效的汽车。
而想要实现这一能力,最核心的就是构建一个完整具身智能大脑:马赫VLA完成机器智能、马赫Mind-Pro与马赫Mind-Edge完成语言智能。
马赫Mind-Pro与马赫Mind-Edge由过去的Mind-GPT经过多轮重构迭代进化而来,前者在通用基准能力方面达到了行业第一梯队水平。而后者是一个为车载场景打造的原生端侧智能体模型,它可以成为用户车内的“私人助理”,帮助寻找物品、照顾家人。
针对车端使用,工程师还进行了大量的车载专用行为特化训练,摆脱传统AI只回答不行动的模式,它可以输出动作、实时调用车辆硬件,时刻在线的全天候主动感知、人车交互、自主控车、多模态问答,都可以在车端本地实现,底并且数据完全不上传。
在智能辅助驾驶方面,马赫VLA实现了更安全、更高效、更强大的能力。
过去,理想全系智能驾驶实现了超过1727万次的主动避险,而随着马赫VLA到来,车辆的主动安全能力进一步提升,无论是面对常见的鬼探头,还是深夜高速路上“隐身”的故障车这种极端场景,系统都能够做出响应。
0.28秒的AEB响应速度,接近顶级F1赛车驾驶员的能力,远超普通人,在120km/h的时速下,可以为用户带来6米的制动距离缩短。而6米,可能意味着一场重大事故的避免。
而在大多数用户感知更明显的日常使用中,系统可以更加拟人,可以主动倒车让行、可以看懂人类的指挥手势完成停车与前进,在发布会的演示场景中,还可以在广州傍晚的雨夜里,丝滑完成人车混行小路的安全、高效通行。
接下来,理想汽车为马赫VLA进化提出的目标是:第三季度,为Orin和Thor平台的老车主,推送全新的马赫VLA裁剪版模型;第四季度,理想辅助驾驶模型能力,对齐特斯拉FSD V14。
04
“堆砌”硬件的本质是什么?
芯片算力的“通胀”或是车企自研芯片,在这个时代里并不是什么新鲜事,但越来越大的数字到底为用户带来了怎样的价值?硬件堆砌的尽头又是什么?其实并没有太多人能够讲清楚。
理想汽车在启动自研芯片设计时,就在思考一个问题:当砖头的质量与数量都无法大幅提升时,能不能重新发明盖楼的方式?
相比于过去统治计算机领域70年的“冯·诺依曼架构”,马赫M100芯片采用了数据流架构。这意味着,计算从过去的按顺序的指令驱动,转变为并行的数据驱动,而后者是天然适合AI计算的。
举个简单的例子:计算“C = A + B、F = C × D”,在冯·诺依曼架构中,会先读A、B,做加法,再读D,做乘法;而动态数据流架构中,A和B一旦到达,加法节点就被触发,C产生后,只要D也已经准备好,乘法节点就自动执行,它更像一张“计算网络”,数据在网络中流动并触发相应运算。
而在马赫M100的基础之上,从心脏、眼睛、大脑、手脚再到神经系统,理想汽车构建了一套完整的具身智能体。这其中,星环OS就是专为具身智能设计的“神经系统”,通过感知、决策、执行的全链路深度融合,在结合全线控底盘的极速响应,最终实现了端到端0.28秒的延时。
这不是单一的芯片快或软件快,而是整个系统的高效。
此外,就像苹果与安卓两个系统谁更安全,大多数人都有着显而易见的答案一样。和苹果将芯片与操作系统一同设计一样,马赫M100芯片最重要的价值之一就是安全,工程师将关键环节的管控权限前置到芯片设计中,再通过全栈自研的软件实现统一调度,让芯片、编译器、操作系统和AI算法在同一套可信的基础上协同运行。
05
大公司视点
李想说:“很多人问我,你们天天在折腾什么?为什么非要搞具身智能?”
这是当理想在终端市场销量遭遇挑战,而李想本人大谈人工智能时,外界最多的疑问和质疑。
事实上,当理想L9 Livis没有到来时,任何的解释与描述都会被认为是“画饼”,甚至直到现在,理想L9 Livis尚未形成规模化、长期化的用户群体时,市场对于“具身智能”的认知仍然是浅薄的。
这并不意外,毕竟即便是火到出圈的豆包,大多数人也只是拿他当个更好用的“搜索引擎”而已,而“龙虾”其实已经超出了大部分人的认知与使用。
而随着全新一代产品的落地,这种认知会一点点被具象化,被生活化。
当理想在为下一个10年铺路时,李想在发布会结束时那句“理想汽车坚持做最好的自己,不要期望我们变成别人”,也就有了更具象的理解。