小鹏联合北大为VLA模型定制视觉token剪枝方法,让自动驾驶更高效
创始人
2026-01-04 18:26:45
0

VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。但现有的视觉 token 剪枝方法都不是专为自动驾驶设计的,在自动驾驶场景中都具有局限性。

小鹏汽车联合北京大学计算机科学学院多媒体信息处理国家重点实验室发表论文《FastDriveVLA》,不仅为自动驾驶 VLA 模型中的高效视觉 token 剪枝建立了新的范式,也为特定任务的剪枝策略提供了有价值的洞察。

受人类驾驶员主要关注前景区域而非背景区域的启发,研究团队做出假设:对于自动驾驶而言,与前景信息相关的视觉 token 比与背景内容相关的视觉 token 更有价值。为了验证这个假设,研究团队构建了大规模自动驾驶标注数据集nuScenes-FG(包含来自 6 个摄像头视角的、带有前景区域标注的 24.1 万个图像 - 掩码对),通过 MAE 风格的像素重建策略和新颖的对抗性前景 - 背景重建策略,训练出了一个适用于不同 VLA 模型的、可以即插即用的视觉 token 剪枝器 ReconPruner

实验结果显示,在不同剪枝比例下,FastDriveVLA 在 nuScenes 开环规划基准测试中均取得了 SOTA 性能。FastDriveVLA 也非常高效,当视觉 token 数量从 3249 减少至 812 时,FastDriveVLA 的 FLOPs 直降约 7.5 倍;在 CUDA 推理延迟方面,FastDriveVLA 将预填充(prefill)时间减少了 3.7 倍、将解码(decode)时间减少了 1.3 倍,显著提升了推理效率。

该篇论文被 AAAI 2026 录用。

相关内容

最新资讯

清华最受师生关注十大亮点成果 为充分发挥高等学校作为基础研究主力军、重大科技突破策源地的作用,营造勇于创新的学术氛围,推动科研工作...
解锁德育“新密码” 共筑育人“... 为深入落实立德树人根本任务,进一步提升德育工作的针对性与实效性,近日,平顶山市第一高级中学在学校党团...
为机器人贴上“电子皮肤” 天大... 天津北方网讯:复杂精密的电子电路化身“热缩保鲜膜”,热风一吹,便严丝合缝地贴附在任意形状的物体表面—...
“经管英才·职引未来”就业服务... 为帮助同学们掌握简历制作的实用技巧,熟悉面试流程与应答逻辑,提升求职竞争力,学院于1月9日下午15时...
最高632!中南财经政法大学2... 一所高校的专业受青睐程度,往往会直接体现在录取分数的高低之上。锦宏高考持续整理高校专业录取数据分析,...
培训机构“蹭名校”搞欺诈高校不... 来源:羊城晚报 □熊丙奇 随着寒假的临近,一些打着高校名义的“培训营”“内推名额”“招生咨询”等虚假...
聚教育科技人才之力 筑兴边富民... 杜雨来 杜玉洁 党的二十届四中全会提出了“一体推进教育科技人才发展”的战略部署。教育、科技、人才内在...
原创 高... 大学老师咋都这么喜欢开比亚迪啊?最近发现个有意思的事儿,全国各大高校的停车场里,到处都能看到比亚迪的...
刘亦菲代言的汽车品牌来了一个比... 1月13日,比亚迪前高管赵长江发文称,已正式加入鸿蒙智行旗下智界汽车,现任智界汽车执行董事及执行副总...
小米汽车保值神话褪色:二手车价... 曾经在新能源汽车市场掀起“保值风暴”的小米汽车,如今正经历着二手车价格的大幅回落。这一变化不仅让二手...