顶端新闻记者 郭丁然/文 时硕/图
12月11日,“AI赋能与数据安全协同发展研讨会暨中原数据审核中心揭牌仪式”在郑州举行。
在技术大爆发的时代,高质量数据标注是智能驾驶安全与可靠的基石。小鹏汽车数据业务总监杨森林在会上围绕智能驾驶以及数据标注人才培育进行了分享。
据他透露,2026年小鹏汽车计划在河南等地培养3000名符合行业需求的标注人才。
数据标注成AI产业核心支撑
中国数据标注产业正迎来快速发展期。根据《2025高质量数据集研究报告》,随着人工智能、大模型技术迭代,我国数据标注产业产值已突破80亿元,高质量数据建设进入规模化、规范化发展阶段。
数据标注产业已被纳入国家战略布局。2024年12月,国家数据局印发的《关于促进数据标注产业高质量发展的实施意见》提出,到2027年,产业规模将大幅跃升,年均复合增长率超过20%。
目前,全国已建成包括四川成都、辽宁沈阳等在内的7个数据标注基地,总规模达17282TB,赋能121个国产人工智能大模型研发,带动相关产值超过83亿元。
杨森林指出,在国家五部门联合出台的《关于加强数据要素学科专业建设和素质人才队伍建设的意见》中,明确提出要推动教育链、人才链、产业链与创新链的深度融合。
这一政策方向与小鹏汽车的数据标注和人才培养实践形成呼应。国家对数据标注核心技术攻关的重视,为产业发展提供了明确指引。
各地政府也在积极响应。青海省于2025年4月发布措施,计划当年培养数据标注产业人才不少于3000人;贵州省则提出到2028年,数据标注从业人员规模将达到5万人左右。
小鹏产教融合规模三年实现跨越式增长
面对行业需求,小鹏汽车率先启动了系统性的校企合作。杨森林回忆道,小鹏在2022年开始与7所职业院校开展试点合作。
2025年,这一合作规模显著扩大,全国合作院校增至30多所,参与实践学生达4000多人。
合作内容也从早期以短期实习为主,逐步深化为包括企业教师入校授课、企业课程开设、校内实习实践、校外就业推荐以及资格证书申报等在内的完整培养体系。
小鹏汽车为何如此重视数据标注?杨森林解释,数据标注的本质是“AI训练师”,这是人工智能模型学习的“教材”。
在智能驾驶领域,这一需求尤为突出。小鹏汽车的自动驾驶基座模型作为以大语言模型为骨干网络的VLA大模型,参数量高达720亿,需要海量优质驾驶数据进行训练。
“人工智能有多少,我们就有多少的人工,因为先人工后智能。”杨森林说,道出了数据标注在AI发展中的基础性地位。
他透露,面向2026年,小鹏汽车计划深化河南、山东、广东三地的业务投放与产教融合,计划通过规模化、统一化的业务实战,培养3000名符合当前行业需求的数据标注人才。
未来培养方向将发生质的变化——从“动手标注”转向“动脑决策”,从业者需具备强大的逻辑推理与因果分析能力。
来源:顶端财经