今天分享的是:2025智能驾驶深度报告:世界模型与VLA技术路线并行发展
报告共计:41页
2025智能驾驶新图景:世界模型与VLA并行,“智驾平权”走进寻常百姓家
近日,国元证券发布的《2025智能驾驶深度报告:世界模型与VLA技术路线并行发展》显示,中国智能驾驶产业正迎来“技术突破+普惠落地”的双重爆发期。随着新能源车市场的持续扩容,智能驾驶功能不再是高端车型的“专属配置”,而是逐步走进10万级亲民车型;技术路线上,“端到端”架构不断迭代,VLA(视觉-语言-行为)与世界模型两大路线并行发展,推动智能驾驶从“能开”向“开好”、从“少数人享有”向“全民普惠”加速迈进。
新能源车与智驾形成“协同增长闭环”,渗透率持续飙升
中国已成为全球汽车产业电动化与智能化的核心引领者。数据显示,2019年至2025年上半年,中国新能源汽车销量虽受宏观环境影响略有波动,但整体保持高速增长,尤其2023-2024年实现显著放量,渗透率先后突破10%、30%、50%等关键关口,意味着每卖出两辆新车,就有一辆是新能源车。
更值得关注的是,新能源车与智能驾驶功能形成了“正向循环”。2019年时,中国新能源车L2级智能驾驶渗透率仅约7%,而到2025年上半年,这一比例已飙升至65%。一方面,车企为提升产品竞争力,越来越多车型开始标配或选配智能驾驶功能;另一方面,消费者购买新能源车后,接触智能驾驶的机会增多,对智能化功能的接受度和使用意愿也随之提升,形成了“销量增长-智驾普及-用户认可-再促销量”的良性循环。
与此同时,智能驾驶产业规模也在快速扩张。2024年中国智能网联汽车产业规模已达11082亿元,同比增长34%,预计到2030年有望突破5万亿元。从产业结构看,“联网-感知-执行-决策”四大功能模块已清晰成型,覆盖芯片研发、传感器制造、软件算法、整车集成等全产业链的企业数量超过7000家,创新活力持续迸发。
“端到端”技术重构智驾架构,四阶段迭代打通全链路
“端到端”是当前智能驾驶技术革新的核心关键词。不同于传统“感知-决策-控制”分层式架构,端到端技术通过统一的大模型骨干网络,打通从传感器原始信号到车辆控制指令的全链路,大幅减少信息损耗与适配成本,让智能驾驶系统具备更强的场景适应能力。
从演进历程看,端到端智能驾驶已历经四个关键阶段。2021年,特斯拉率先提出“BEV+Transformer”方案,开启第一阶段——通过BEV(鸟瞰图视角)将多传感器数据整合为3D场景框架,搭配Transformer的注意力机制,让车辆拥有“上帝视角”,显著提升环境感知精度;2022年进入第二阶段,特斯拉引入“占用网络”,通过体素级空间建模,精准识别道路上的车辆、行人甚至土堆、石块等“泛目标”,解决了传统感知在遮挡、复杂形状识别上的短板。
当前,行业已进入第三、四阶段。第三阶段是“模块化端到端”,以小鹏、华为为代表,感知模块不再输出人类可理解的结果,而是直接输出特征向量,与决策规划模块联合训练,减少模块间的误差累积;第四阶段则是更极致的“OneModel(一段式端到端)”,以特斯拉、理想为代表,从原始信号输入到最终行驶轨迹输出,全程由单一深度学习模型完成,实现了感知、决策、控制的深度集成,让智能驾驶系统更接近人类“思考-行动”的逻辑。
VLA与世界模型并行:一条快落地,一条谋长远
随着端到端技术的成熟,当前智能驾驶已分化出两条核心技术路线,二者并非对立,而是各有侧重、并行发展。
VLA(视觉-语言-行为)路线主打“快速迭代、兼容量产”,核心是打通“看-懂-做”的全链路语义化转化。简单来说,车辆先通过摄像头感知环境,再将视觉信息转化为类似人类语言的“指令”(如“前方50米有静止车辆”),接着由大语言模型生成驾驶建议,最后转化为具体的控制动作。2024年以来,国内车企已加速推进VLA量产:小鹏在G7车型上率先实现VLA上车,采用“云端强化-端侧蒸馏”的技术路径,先在云端训练大模型,再压缩为轻量版本部署到车端;理想则推出Mind VLA系统,通过3D高斯表征建模与云端统一世界模型,支持自然语言交互与非标交通标志识别;小米也推出ORION架构,通过视觉编码器、大语言模型与生成式规划器的组合,实现多模态轨迹生成。
世界模型路线则更侧重“底层认知、物理推演”,追求更接近人类的“预判能力”。它不依赖语言中间层,而是直接将3D点云、高斯表征等空间数据输入模型,在“虚拟大脑”中模拟物理规律(如车辆碰撞风险、行人运动轨迹),提前推演多种场景可能性,再输出控制指令。目前,特斯拉FSD系统正从传统端到端向“世界模拟器”演进,减少对高精地图的依赖;蔚来的NWM(神经世界模型)可在100毫秒内推演216种行驶轨迹,预测120秒内的路况,尤其在极端天气、施工路段等复杂场景中,能提升决策稳定性;华为也推出Magic DriveDiT模型,通过时空条件编码,高保真复现真实驾驶场景,为仿真测试与算法迭代提供支撑。
“智驾平权”加速:10万级车型也能享高阶功能
过去,高阶智能驾驶功能多集中在30万元以上的高端车型,而2025年以来,“智驾平权”成为行业关键词,头部自主品牌集体发力,将智能驾驶的价格门槛拉至10万-15万元区间。
比亚迪率先打破价格壁垒,其秦PLUS智驾版售价仅11.98万元,却搭载了高速NOA(自动导航辅助驾驶)功能,让普通消费者花“买菜车”的钱就能享受高阶智驾;吉利则推出15万元的银河星耀8EM,将“车位到车位”全场景智驾作为标配,覆盖从家到公司、从停车场到主干道的完整出行链条。这些车型之所以能实现“低价高配”,背后是规模化生产、供应链整合与国产芯片突破的支撑——比如比亚迪通过自研芯片降低硬件成本,吉利则借助供应链协同优化算法部署。
数据显示,2024年1-4月,国内中高阶智驾(高速NOA)搭载率仅11.8%,而到2025年同期已提升至18.6%;20万-30万元价位车型的L2++(城市NOA级别)搭载率,更是从2024年一季度的25.15%飙升至2025年4-5月的47.11%,近乎翻倍。按照当前趋势,未来1-2年内,10万元级别车型有望全面标配高速NOA,智能驾驶将真正成为“每辆车的基础配置”。
从“功能普及”到“体验升级”,智能驾驶未来更懂场景
随着技术的持续迭代,智能驾驶正从“解决有无”向“提升体验”进阶。一方面,硬件层面,国产芯片快速崛起,地平线征程6芯片算力达560TOPS,支持全场景智驾,已获理想、比亚迪等车企定点;黑芝麻智能A2000芯片算力更是达到主流旗舰芯片的4倍,为L4级智驾储备技术;传感器领域,激光雷达与纯视觉方案协同发展,激光雷达为高阶智驾提供安全冗余,纯视觉则通过算法优化降低成本,适配不同价位车型。
另一方面,软件层面,VLA与世界模型的融合成为新趋势——VLA擅长快速理解场景语义,世界模型擅长推演物理规律,二者结合能让车辆既“懂规则”又“懂预判”。比如面对突发的“行人横穿马路”场景,VLA可快速识别“行人+马路”的语义信息,世界模型则能推演行人的运动轨迹,提前规划避让路线,让驾驶更安全、更从容。
未来,随着算法迭代、算力提升与场景数据积累,智能驾驶将进一步突破复杂路况的限制,在城市拥堵路段、夜间行车、恶劣天气等场景中展现更强的适应性。对于普通消费者而言,智能驾驶不再是“冷冰冰的技术名词”,而是能切实减少驾驶疲劳、提升出行安全的“日常伙伴”,真正重塑人类的出行体验。
以下为报告节选内容
报告共计: 41页
中小未来圈,你需要的资料,我这里都有!