车内外人像动作及自动驾驶高质量数据集
推荐单位:中国联合网络通信集团有限公司
申报单位:联通(广东)产业互联网有限公司、广州祺宸科技有限公司
一、背景
在自动驾驶技术愈发普及的今天,自动驾驶的安全性与准确性问题日益凸显。广东联通携手祺宸科技依托各自在标注及自动驾驶行业的能力深耕,旨在通过构建覆盖车内驾驶行为、车外行人意图与多模态环境感知的高质量数据集,解决复杂路况与极端天气下感知精度不足、行为理解不全面等问题,显著提升模型识别准确率与主动安全预警能力,助力自动驾驶系统稳定落地与推广应用。
车内外人像动作及自动驾驶高质量数据集构建流程
二、方案和成效
一是构建多模态高质量数据集,覆盖自动驾驶核心场景。聚焦车内驾驶行为、车外行人意图与多模态环境感知三大方向,采集包含近1亿张驾驶舱内典型驾驶状态及行人高风险行为的图片、视频数据,复杂路况、极端天气、弱纹理环境等600万帧多源感知场景的点云数据,形成结构化、标签体系完善的数据集,解决了自动驾驶在真实环境中感知精度不足、场景覆盖不全的问题。
二是引入智能预标注与多轮质控机制,显著提升数据标注效率与成果一致性。依托自研智能预标注算法,融合3D检测、BEV感知、多帧时序建模等技术,将标注效率提升70%以上,一致性提升至95%以上;配合人工精修与交叉质检,形成“机器先标—人工优化—模型复评”的高可信标注闭环,确保数据高质量交付。
三是实现高质量数据集在自动驾驶关键业务模块的落地应用。数据集已广泛服务于驾驶员疲劳检测、车外行人行为预测、交通意图理解与主动安全预警等核心业务场景,有效提升模型在复杂场景下的识别准确率20%以上,减少误检漏检率30%,助力自动驾驶系统在真实道路环境中稳定运行。
三、创新点
一是面向人车交互的动态行为精准感知。聚焦城市交通等关键场景,自研轻量化动捕与行为建模算法,识别“转头”“犹豫”等细微行为动作,模型识别准确率达92.5%;车内疲劳驾驶行为识别准确率达94.1%,为主动安全控制策略提供高可信数据支撑。
二是模型驱动的动态标注优化推进高质量数据集构建。引入“模型-人联合标注”机制,建立模型置信度回流系统,结合难样本主动识别与区域标注反馈优化,减少返工率超过40%,有效提升复杂数据任务的一致性控制与规模化交付效率。
三是极端环境下弱纹理场景感知数据的补充。在夜间、雨雾、逆光等复杂环境中,应用基于Transformer的图像增强+多帧时序聚合算法,弱纹理目标检测召回率提升21.7%,有效解决行业高误识难题。