2025智能驾驶深度报告：世界模型与VLA技术路线并行发展_科技资讯_新闻资讯

2025智能驾驶深度报告：世界模型与VLA技术路线并行发展

创始人

2025-10-31 11:10:21

0次

今天分享的是：2025智能驾驶深度报告：世界模型与VLA技术路线并行发展

报告共计：41页

2025智能驾驶新图景：世界模型与VLA并行，“智驾平权”走进寻常百姓家

近日，国元证券发布的《2025智能驾驶深度报告：世界模型与VLA技术路线并行发展》显示，中国智能驾驶产业正迎来“技术突破+普惠落地”的双重爆发期。随着新能源车市场的持续扩容，智能驾驶功能不再是高端车型的“专属配置”，而是逐步走进10万级亲民车型；技术路线上，“端到端”架构不断迭代，VLA（视觉-语言-行为）与世界模型两大路线并行发展，推动智能驾驶从“能开”向“开好”、从“少数人享有”向“全民普惠”加速迈进。

新能源车与智驾形成“协同增长闭环”，渗透率持续飙升

中国已成为全球汽车产业电动化与智能化的核心引领者。数据显示，2019年至2025年上半年，中国新能源汽车销量虽受宏观环境影响略有波动，但整体保持高速增长，尤其2023-2024年实现显著放量，渗透率先后突破10%、30%、50%等关键关口，意味着每卖出两辆新车，就有一辆是新能源车。

更值得关注的是，新能源车与智能驾驶功能形成了“正向循环”。2019年时，中国新能源车L2级智能驾驶渗透率仅约7%，而到2025年上半年，这一比例已飙升至65%。一方面，车企为提升产品竞争力，越来越多车型开始标配或选配智能驾驶功能；另一方面，消费者购买新能源车后，接触智能驾驶的机会增多，对智能化功能的接受度和使用意愿也随之提升，形成了“销量增长-智驾普及-用户认可-再促销量”的良性循环。

与此同时，智能驾驶产业规模也在快速扩张。2024年中国智能网联汽车产业规模已达11082亿元，同比增长34%，预计到2030年有望突破5万亿元。从产业结构看，“联网-感知-执行-决策”四大功能模块已清晰成型，覆盖芯片研发、传感器制造、软件算法、整车集成等全产业链的企业数量超过7000家，创新活力持续迸发。

“端到端”技术重构智驾架构，四阶段迭代打通全链路

“端到端”是当前智能驾驶技术革新的核心关键词。不同于传统“感知-决策-控制”分层式架构，端到端技术通过统一的大模型骨干网络，打通从传感器原始信号到车辆控制指令的全链路，大幅减少信息损耗与适配成本，让智能驾驶系统具备更强的场景适应能力。

从演进历程看，端到端智能驾驶已历经四个关键阶段。2021年，特斯拉率先提出“BEV+Transformer”方案，开启第一阶段——通过BEV（鸟瞰图视角）将多传感器数据整合为3D场景框架，搭配Transformer的注意力机制，让车辆拥有“上帝视角”，显著提升环境感知精度；2022年进入第二阶段，特斯拉引入“占用网络”，通过体素级空间建模，精准识别道路上的车辆、行人甚至土堆、石块等“泛目标”，解决了传统感知在遮挡、复杂形状识别上的短板。

当前，行业已进入第三、四阶段。第三阶段是“模块化端到端”，以小鹏、华为为代表，感知模块不再输出人类可理解的结果，而是直接输出特征向量，与决策规划模块联合训练，减少模块间的误差累积；第四阶段则是更极致的“OneModel（一段式端到端）”，以特斯拉、理想为代表，从原始信号输入到最终行驶轨迹输出，全程由单一深度学习模型完成，实现了感知、决策、控制的深度集成，让智能驾驶系统更接近人类“思考-行动”的逻辑。

VLA与世界模型并行：一条快落地，一条谋长远

随着端到端技术的成熟，当前智能驾驶已分化出两条核心技术路线，二者并非对立，而是各有侧重、并行发展。

VLA（视觉-语言-行为）路线主打“快速迭代、兼容量产”，核心是打通“看-懂-做”的全链路语义化转化。简单来说，车辆先通过摄像头感知环境，再将视觉信息转化为类似人类语言的“指令”（如“前方50米有静止车辆”），接着由大语言模型生成驾驶建议，最后转化为具体的控制动作。2024年以来，国内车企已加速推进VLA量产：小鹏在G7车型上率先实现VLA上车，采用“云端强化-端侧蒸馏”的技术路径，先在云端训练大模型，再压缩为轻量版本部署到车端；理想则推出Mind VLA系统，通过3D高斯表征建模与云端统一世界模型，支持自然语言交互与非标交通标志识别；小米也推出ORION架构，通过视觉编码器、大语言模型与生成式规划器的组合，实现多模态轨迹生成。

世界模型路线则更侧重“底层认知、物理推演”，追求更接近人类的“预判能力”。它不依赖语言中间层，而是直接将3D点云、高斯表征等空间数据输入模型，在“虚拟大脑”中模拟物理规律（如车辆碰撞风险、行人运动轨迹），提前推演多种场景可能性，再输出控制指令。目前，特斯拉FSD系统正从传统端到端向“世界模拟器”演进，减少对高精地图的依赖；蔚来的NWM（神经世界模型）可在100毫秒内推演216种行驶轨迹，预测120秒内的路况，尤其在极端天气、施工路段等复杂场景中，能提升决策稳定性；华为也推出Magic DriveDiT模型，通过时空条件编码，高保真复现真实驾驶场景，为仿真测试与算法迭代提供支撑。

“智驾平权”加速：10万级车型也能享高阶功能

过去，高阶智能驾驶功能多集中在30万元以上的高端车型，而2025年以来，“智驾平权”成为行业关键词，头部自主品牌集体发力，将智能驾驶的价格门槛拉至10万-15万元区间。

比亚迪率先打破价格壁垒，其秦PLUS智驾版售价仅11.98万元，却搭载了高速NOA（自动导航辅助驾驶）功能，让普通消费者花“买菜车”的钱就能享受高阶智驾；吉利则推出15万元的银河星耀8EM，将“车位到车位”全场景智驾作为标配，覆盖从家到公司、从停车场到主干道的完整出行链条。这些车型之所以能实现“低价高配”，背后是规模化生产、供应链整合与国产芯片突破的支撑——比如比亚迪通过自研芯片降低硬件成本，吉利则借助供应链协同优化算法部署。

数据显示，2024年1-4月，国内中高阶智驾（高速NOA）搭载率仅11.8%，而到2025年同期已提升至18.6%；20万-30万元价位车型的L2++（城市NOA级别）搭载率，更是从2024年一季度的25.15%飙升至2025年4-5月的47.11%，近乎翻倍。按照当前趋势，未来1-2年内，10万元级别车型有望全面标配高速NOA，智能驾驶将真正成为“每辆车的基础配置”。

从“功能普及”到“体验升级”，智能驾驶未来更懂场景

随着技术的持续迭代，智能驾驶正从“解决有无”向“提升体验”进阶。一方面，硬件层面，国产芯片快速崛起，地平线征程6芯片算力达560TOPS，支持全场景智驾，已获理想、比亚迪等车企定点；黑芝麻智能A2000芯片算力更是达到主流旗舰芯片的4倍，为L4级智驾储备技术；传感器领域，激光雷达与纯视觉方案协同发展，激光雷达为高阶智驾提供安全冗余，纯视觉则通过算法优化降低成本，适配不同价位车型。

另一方面，软件层面，VLA与世界模型的融合成为新趋势——VLA擅长快速理解场景语义，世界模型擅长推演物理规律，二者结合能让车辆既“懂规则”又“懂预判”。比如面对突发的“行人横穿马路”场景，VLA可快速识别“行人+马路”的语义信息，世界模型则能推演行人的运动轨迹，提前规划避让路线，让驾驶更安全、更从容。

未来，随着算法迭代、算力提升与场景数据积累，智能驾驶将进一步突破复杂路况的限制，在城市拥堵路段、夜间行车、恶劣天气等场景中展现更强的适应性。对于普通消费者而言，智能驾驶不再是“冷冰冰的技术名词”，而是能切实减少驾驶疲劳、提升出行安全的“日常伙伴”，真正重塑人类的出行体验。

以下为报告节选内容

报告共计： 41页

中小未来圈，你需要的资料，我这里都有！

路线车辆技术深度报告模型并行阶段新能源世界智能车型智驾端到端

上一篇：喜报！中汽创智具身智能策源团队论文成果入选全球机器人顶级会议IROS 2025

下一篇：国际驾照翻译选择“慧办好”靠谱又方便！

2025智能驾驶深度报告：世界模型与VLA技术路线并行发展

相关内容

最新资讯