“数据投毒”或诱发有害输出!AI数据污染分为几类?专家解读→
创始人
2025-08-17 22:14:41
0

(央视财经《第一时间》)近日,国家安全部门发布提示:通过篡改、虚构和重复等“数据投毒”行为,对AI数据进行污染,有可能诱发有害输出。什么是数据投毒?会引发哪些风险?

网络安全专家 曹辉:“数据投毒”主要针对两个方面,一是针对视觉类,二是针对自然语言处理类。例如这张图片是一个斑马识别人工智能系统的训练数据,这张照片对很多斑马进行了标注。如何进行数据污染?在其中的一匹斑马身上加一个绿点,加了绿点的斑马,特意不进行标注。这样的训练数据大概会有几万张,在这几万张训练数据里其中的三四张进行类似的污染处理,就会导致大模型生成的模型带有后门,结果就是当大模型再见到类似身体上有绿点的斑马,它就不会认为这是斑马,导致AI模型的判断受到干扰。

专家介绍,人工智能数据污染分为两类,一种是人为主观恶意去篡改数据,误导人工智能的输出结果,另一种是人工智能本身会海量地收集网络上的庞大数据,其中不良信息如果没有被甄别删除掉,而是当作可以信任的信息源加入算力中,输出的结果同样不可信任。

网络安全专家 曹辉:大模型训练需要大量的数据,所以大部分的互联网数据,包括书报、电影的对话台词数据,都是训练数据通常的收集范围。大家都有可能往互联网上发一些数据,一旦这些数据是不安全的,被污染的,大模型也可能会随之受到影响。

转载请注明央视财经

编辑:潘煦

相关内容

最新资讯

泽连斯基抵达华盛顿,将与特朗普... 中新网8月18日电 据美媒报道,当地时间17日晚间,乌克兰总统泽连斯基抵达美国首都华盛顿。 资料图...
原创 9... 马上要进入2025年9月,各地发布了电动车管理的相关规定,进一步加强电动车管理,从9月1日起,电动车...
你知道吗?高考是哪一年恢复的,... 你知道吗?高考是哪一年恢复的,看完你就明白了! 在这个充满知识与梦想的时代,高考作为中国教育体系中的...
全球电动汽车销量1070万辆:... 尽管部分地区销量增速放缓,但 2025 年全球电动汽车销量仍同比上涨 27%—— 这一数据背后,是不...
增动能 启新篇 向全球——20... 由中国汽车技术研究中心有限公司、中国汽车工程学会、中国汽车工业协会、中国汽车报社共同主办,天津经济技...
2025-2029年汽轮机及辅... 汽轮机也称蒸汽透平发动机,是一种旋转式蒸汽动力装置,高温高压蒸汽穿过固定喷嘴成为加速的气流后喷射到叶...
专升本机构精选助你圆梦升学 对于许多专科生来说,专升本是一次改变学历背景的重要机会。然而,备考过程中难免会遇到各种困难,比如基础...