作者 | 施晶晶
编辑 | 向现
9月20日,锡林浩特公安局对外发布通告称,9月5日起集中采集辖区内男性居民血样录入本地DNA数据库。
通告称,“本次血样采集的作用是完善公民身份信息,直接关联到个人身份证、护照等证件的办理。并且对于防范老人儿童走失、人员身份信息确认等方面,具有重大作用。”
锡林浩特公安局发布通告
不同于指纹和人脸信息,DNA数据是很多人的知识盲区,而是否有法律授权等程序问题之外,为何独独采集男性居民DNA,是否强制,采集的信息如何被使用和保护,实际作用有多大……通告未详细解释,也引发关注和追问。
其后,锡林浩特市公安局回应媒体称,不强制,采集男性DNA数据是出于建设“Y库”的需要。
南风窗检索发现,近年来,全国各地公安相继推进“Y库”建设。2019年以来,各地公安局以县市为单位,集中就“Y库”建库服务进行采购招标。在这些招标文件中,“Y库”通称为“男性家系排查系统”。
福泰社区联合辖区派出所开展DNA采集行动 / 图源:呼和浩特市新城区丁香北路街道办事处
在法医学上,运用Y库比对DNA的方式,叫做Y-STR家系排查(下称:Y染色体家系排查),是进行DNA分析与鉴定的一种技术手段。
DNA比指纹和人脸更深远的影响力,促使人们对它的扩张更加谨慎。但这究竟是一门怎样的技术,又有哪些潜在的风险?
为什么是男性?
“专门找Y,这个基本肯定是为了找罪犯。”南京大学法学院副教授田芳告诉南风窗。
“Y库”标识的“Y”,特指男性独有的Y染色体,同一父系内的男性,包括兄弟、父子、叔侄、堂兄弟和祖孙等,通常有一致或极为接近的Y染色体。
当中有一段Y-STR基因序列,它被称为“姓氏基因”,稳定地遗传给下一代男性。因此,通过比对它,就能在茫茫人海当中,判定两个男性是否来自同一父系祖先。
如果两个人有4个Y染色体STR位点完全匹配,他们拥有共同父系祖先的概率接近95%,如果有5到9个STR位点完全匹配,概率逼近100%——这是Y染色体家系排查的原理。
即便比中了Y-STR基因片段,并将范围缩小到五服以内的小家系,确定嫌疑人仍需大量排查工作
多年来,“Y-STR检测技术”多用于法医学亲子鉴定和个体识别、人类种群学、人类起源和进化研究,但除此之外,在犯罪侦查当中,它也为寻找犯罪嫌疑人提供了便利。
中国刑事警察学院赵恒旭在《Y-STR检测技术在侦查破案中的应用研究》中提及,在全国各级法院判决生效的刑事案件中,男性罪犯占比达90%以上。而在犯罪侦查当中,男性犯罪嫌疑人留在作案现场的毛发、血液、皮屑、精液,都可以提取到Y染色体。
《Y-STR检测技术在侦查破案中的应用研究》中提及的Y-STR检测技术的应用局限性
只要犯罪嫌疑人所在的家系中有一名或几名男性成员的DNA信息在库,Y-STR基因序列比对成功,即可引导侦查人员在其家族内展开排查。
这弥补了传统比对常染色体基因的不足,因为它的条件非常苛刻,只有当作案现场提取的“未知来源”的检材与“已知来源”的比对样本来自同一人时才能发挥作用,这种“点对点”的模式使得案件侦破常常受阻,而Y染色体家系排查打开了一个突破口。
库擅长“模糊检索”
Y库找人,是把排查范围缩小到犯罪嫌疑人所在的家族群,再结合常染色体比对,精准锁定犯罪嫌疑人,这种侦办思路被概括为“以Y找群,以常锁人”,能避免大海捞针,节省时间和成本。
2016年,白银连环杀人案在28年后最终破案,就是Y库起了作用。
当时公安部专案组提供了Y染色体数据库,包含过去采集的一万多份血样,通过与作案现场提取到的Y染色体进行比对,发现一份27个点位比对一致的结果,顺藤摸瓜找到了青城镇高氏家族,最终找到了高承勇,结合DNA和指纹比对结果,确定他就是白银案的犯罪嫌疑人。而在Y库中比对到的已知样本,来自高承勇的堂兄,此前因犯罪而被采集了样本。
“白银案’犯罪嫌疑人高承勇被警方抓获 / 图源:甘肃日报
技术上,Y染色体家系排查可供追溯的时效很长。
“数据库中每个人的Y-STR序列都具有其家族代表性,这种代表性不会因为入库个体逝世而消失,每个人的寿命是有限的,但数据库内的Y-STR信息具有长远的生命力。即便受基因突变产生的影响,随着家族不断延绵,Y库内的遗传信息仍然具备恒久的检测价值。”赵恒旭写道。
不过,Y染色体家系排查往往很粗糙。同一父系祖先可以追溯十数代人,覆盖多个省份和家族分支,待排查人数其实极为庞大。
2021年,公安部物证鉴定中心剖析了2006年西北某省女出租车司机被杀一案的排查细节,当时常染色体比对无结果,转而从Y库当中比中了五省市不同姓氏的11个家族,需要排查上万人。
2006年女出租车司机遇害案案件侦破流程:Y库家系排查大家系的基础上,用SNP进一步缩小家系范围
而后是结合更新的法医SNP技术,推断比中家系与嫌疑人的亲缘关系远近,锁定近200年以内的近代小家系。最终用29份SNP样本锁定了目标家系,再往下圈定犯罪嫌疑人。
Y库比对,侵犯隐私吗?
血样当中,DNA包含大量遗传隐私信息,而建设Y库所采集的DNA在多大程度上触及隐私信息,也是公众关切。
田芳做过研究,她告诉南风窗,目前刑事侦查中DNA鉴定一般是对DNA上的STR位点进行分析,被检测的属于非编码区域的基因,所以DNA鉴定技术并不能使刑侦人员获得个人遗传信息,而只能获得个人识别信息,从技术上而言,DNA鉴定技术对公民隐私权侵犯并不太大。
公安部物证鉴定中心的一项研究也以同样理由有类似判断,认为“并不如一些观点所担心的那样会涉及触及个体的遗传学隐私”。
但他也指出,遗传学意义上的隐私不等同于社会学意义上的隐私。Y库中涉及到的家系信息完全属于隐私范畴,特别如非婚生、送养现象,如果泄露将对对方的社会、家庭关系产生冲击。
遗传学意义上的隐私与社会学意义上的隐私并不等同 / 图源:pexles
与此同时,建设Y库涉及环节、人员众多,从搜集、整理、存储、应用,主观故意和客观疏忽均可能导致泄露、误用和滥用。
技术也在更新换代。中国人民大学一篇博士论文指出,与STR分型技术相比,SNP技术可以推测个体的外貌特征,如眼睛颜色、头发颜色,或者预测是否患上某种特定的疾病,后者可能导致基因歧视,影响保险或就业。
DNA采集,规范与边界
相当一段时间里,在寻亲打拐、打击犯罪的叙事里,采集DNA过程中的个人信息乃至隐私保护时常被忽视。
2016年,在国务院的留言板上,一条留言写道:每当我看到中央台《今世缘·等着我》节目,找到失联亲人时的激动,失联亲人杳无音信时的失望,令我难忘;案件物证难取,尸源难寻,案件一筹莫展时充满焦虑。其实,现代科学技术已基本可以解决上述问题,特建议尽快将DNA数据作为户口资料。
《今世缘·等着我》剧照
公安部在回复中说:DNA信息采集涉及伦理、个人隐私等社会问题,需要社会统一认识,也需要法律授权。鉴于目前我国户口、身份证等相关法律法规未对建立DNA数据库作出规定,将DNA数据纳入户籍资料需提请全国人大立法决定。从目前条件看,将DNA数据纳入户口资料管理应用的时机尚不成熟。
2015年,公安部物证鉴定中心时任副主任法医师刘冰在《现阶段我国DNA数据库发展的几个关键问题》提及:我国关于DNA数据库没有专门立法,关于数据库中人员样品的采集目前往往援引《中华人民共和国刑事诉讼法》的规定:
为了确定被害人、犯罪嫌疑人的某些特征、伤害情况或者生理状态,可以对人身进行检查,可以提取指纹信息,采集血液、尿液等生物样本。(注:该规定与现行刑事诉讼法最新修订版本一致)
“Y-STR数据库人员样品采集的特点是:地理空间相对封闭,涉及人员范围广,需同时搜集家系资料,被采集人多数不在法律规定覆盖范围里。”刘冰坦言,并预言,“上述特点决定,样品采集的过程必然产生社会影响,在公民法制意识日益增强的当今社会,DNA数据库的法律支持问题日益引起关注。”
DNA可以用于辨别凶手身份 /《他是谁》剧照
刘冰同时指出,实际上类似Y库这类复杂亲缘关系检索并不适用于我国,原因之一是它通常适用于封闭的小区域,低流动性人群,而我国DNA数据库中多数数据来自于流动人口。随着人员流动性越来越大,越来越多的人进入城市工作和生活,对Y染色体家系排查应用是一种挑战。
但客观上出于侦查破案的现实需求,以及主观上最大化数据库效益,“开展复杂亲缘关系检索是我国DNA数据库应用在一个较长时期内的合理补充和必然选择”,刘冰写道。但其使用应当遵循严格的规则,程序上体现为:只限于最重大案件,已无其它的线索和信息供案件调查使用,且用于比对的现场物证经分析确定来源于犯罪嫌疑人,对于嫌疑人来源的地区要有严格的预判,必须有其他非DNA信息作为辅助筛选的因素。
现实中虽有“法庭科学 DNA 数据库建设规范”等国家标准,关注点是技术和质量,未提及DNA 数据库的使用目的、DNA 样本强制采集的对象与程序、样本的销毁程序、保留的时限以及 DNA 数据库的监管措施。
Y库的来时路
郑州是Y库的早期探索者。
《郑州市Y-STRDNA数据库建设及应用的调查研究》复盘了当地建设Y库的思路。
2002~2007年,在郑州登封市先后发生了 16 起强奸案,现场勘查及外围信息反馈表明,案件极有可能系一人所为。 案件久侦不破,影响十分恶劣。2008年,该案被省厅列为一号案件,重点督办。
尽管在作案现场提取了精斑,但比对当地5000多名无法排除嫌疑的男性的常染色体DNA,一无所获,于是专案组转而寻求Y-STR技术展开男性家系排查,开始对案发10个乡镇的89个行政村,分片包干,逐村、逐姓、逐户制作家系图谱、采血、检验。
历时2个多月,专案组采集了7000多份样本,制作了3000多份家系图谱,最终锁定了犯罪嫌疑人,案件才得以告破。
通过Y-STR技术有利于高效率锁定犯罪嫌疑人 / 图源:pexels
侦破过程中,边搜集家系信息、边采集Y-STR样本、边进行检测排查,耗费大量的时间,事后一个设想被提了出来:“能否事先建立一个全市、全省乃至全国的家系Y-STR样本数据库,这样在案件发生的时候就可以直接将现场生物物证的Y-STR信息与数据库进行比对,以便迅速破案?”——这为郑州警方建立Y库埋下了种子,并付诸实施。
具体采集方案遵循以下原则:
一是人数原则,5人以下家系每支采集1人样本,6人以上家系每支采集2人样本,过大家系可以增加样本采集数量;二是血缘分散原则,即所采集人员的血缘尽可能的远,且尽量在家系中成员较多的分支中采集;三是年龄适中原则,即选中的被采集人的年龄尽量选取在15~45岁之间;四是“外来人员”必采原则,即若家系中有入赘、抱养、离婚和娶妻带子、私生等情况的,必须采集上述人员或其一名男性后代的样本,保证样本的代表性。
上述调研报告披露:2015年,郑州公安局完成了全市辖区内11万支家系的调查,涉及被调查人员300多万。
2016年,白银案让Y-STR技术,即“男性Y染色体家系排查系统”名声大噪。从事法庭科学、法医基因组学研究的学者葛建业早年受访时称,在白银案之后,各地市纷纷仿效建立Y库,公安部也召集专家讨论,并在2018年转化为建设Y库的决策。
白银案犯罪嫌疑人高承勇青城镇城河村的宅子 / 图源:视觉中国
在公开报道当中,这项技术几乎总是和陈年积案、重大命案一起出现。除了白银案,2020年2月破案的南医大女生遇害案,也是据此在28年后锁定犯罪嫌疑人。
2020年4月,公安部开展“云剑-2020”行动,并将“命案积案”攻坚作为此次专项行动的工作重点。当年9月,公安部通报,全国共破获命案积案3580余起,超过去年全年破案总数一倍,10年以上积案占比超9成。
其中,新技术、新手段成为破案利器,占比超7成,包括Y-STR家系排查在内的DNA检测技术破案500余起。
Y-STR技术成为破案利器 / AI制图(诺言)
时至今日,不少县市仍在跟进建设Y库。
即便不少观点指出,建设Y库的目的是弥补现阶段DNA数据库人口覆盖率不足短板,是过渡时期的手段,并且“规模性地启动Y-STR数据库建设,其成本和效益的综合比是很低的……前期建设的人力投入和后期应用的侦查成本远远高于常染色体STR”,刘冰写道。
DNA数据库的全球扩张
不只是Y库,全球范围内,DNA数据库也在扩张。
比如采集对象开始扩展到移民,欧美等国推进跨国交换DNA数据库……也引发法律和伦理争议。
用英文检索“DNA数据库”研究论文,排在前列的一篇被收录进美国国立卫生研究院,其主张:DNA数据库越大,破获的犯罪就越多,预防的未来犯罪就越多,节省的资金就越多……
2024年末,发表在《国际法医科学》期刊的一篇研究对此忧心忡忡:1995年,英国建立了第一个可供检索的国家DNA数据库,目前,世界上大多数国家都有DNA数据库。
国际刑警组织曾于2019年颁布《DNA数据库最佳实践》,但其中的建议主要旨在提高流程的质量和效率,伦理、治理、权益保护等主题仅作为相关考虑因素被提及,并未建议任何最低保障措施。
DNA数据库的建立要考虑质量效率,伦理、治理、权益保护等因素 / 图源:pexels
曾经被提倡的“比例原则”——即要求DNA数据的收集、保存和使用,必须对调查和预防犯罪的合法目的做出必要且适当的回应,同时尽量减少对个人隐私和人身权利的侵害——也缺乏保障。
这是技术扩张的现实。
“现在,DNA技术基本上大家都在用,它太方便了,一会儿就检测出来了,准确率又高,哪里有比这更好的证据。”田芳说,“美国原来也讲排除非法证据,就是‘你把我的DNA采集过去了,凭什么?’现在人家提得也少了。”
相比技术的突飞猛进和现实应用中的便捷,呼吁立法的声音显得有些微弱,相关的法律和伦理规范,总是在其应用之后才开始追赶。
DNA数据的收集、保存和使用没有一个固定的标准
“没有一个固定的标准。”在跨国对比当中,田芳无奈地发现,不仅各国法律不一,现实当中“模糊地带挺多的……很多事情的发展并不是我们想象的那个样子,有风险就不用,其实大家都在用”。
一如曾经手机定位、电子支付、人脸识别都有争议,但现在应用都很普遍。而对普通人来说,“隐私不隐私,还是看大家接不接受”,田芳说。
8月下旬,湖北襄阳的一个农村,镇派出所的人带着村医来采集户主的血样,说是县公安局要。一位村民的女儿告诉南风窗,尽管不清楚采血的用途、患有免疫性血小板减少症其实不宜采血的父亲,还是配合扎了手指。