伦理发展与科技密不可分。在当今大数据时代,“数据”一词的使用频率已超过“信息”。数据作为实体化的记录形式,往往比信息本身更具具体性和客观性。因此,随着大数据和数据科学的蓬勃发展,数据伦理的概念日益凸显其重要性。这种伦理观念正逐渐被认可,并开始替代诸如“机器人伦理学”、“机器伦理学”和“计算机伦理学”等传统术语。
数据伦理学是伦理学的一个分支,专门研究数据与数据科学领域的行为规范。它深入探讨数据相关活动中的伦理议题、伦理挑战及两难困境,尤其关注可能影响人类福祉的个人权利与利益问题。该学科还致力于探索促进负责任数据管理及数据科学实践的解决方案,为行业提供可持续发展的指导。
伦理是负责任治理的基础。数据伦理建立在计算机和信息伦理中先前建立的原则之上,寻求研究与数据相关活动的伦理问题、伦理挑战和困境以及这些问题的潜在解决方案,以确保负责任地开展数据和数据科学相关活动的实践。
真正发挥数据伦理的规范作用,促进负责任的数据处理和应用,关于数据伦理学应该解决三个主要问题:什么是数据伦理? 数据伦理学规范和解决的问题,以及指导践行数据伦理学的原则和路径。在探讨数据伦理时,有两个核心问题需要重点解答:数据伦理的定义是什么?它具体涵盖哪些内容?虽然目前尚未形成统一的数据伦理定义共识,但现有定义为数据伦理的范畴提供了界定依据,并为数据治理提供了指导原则。此外,数据伦理的考量范围远不止于遵守个人数据保护法规。
美国联邦政府制定的数据伦理框架中,定义数据伦理是“在获取、管理或使用数据时促进适当判断和问责的行为规范,其目标是保护公民自由,最小化对个人和社会的风险,并最大化公共利益。”该定义明确了数据伦理的目的,是相对被认可的有关数据伦理的定义。
Luciano Floridi 和 Mariarosaria Taddeo在“什么是数据伦理”论著指出,从宏观伦理学视角来看,数据伦理能够为数据科学的社会价值最大化提供解决方案。鉴于其固有的复杂性,他们主张数据伦理应从一开始就作为宏观伦理学来构建。他们提出“数据伦理是伦理的一个新分支,研究和评估与数据(包括生成、记录、管理、处理、传播、共享和使用)、算法(包括人工智能、人工代理、机器学习和机器人)和相应的实践(包括负责任的创新、编程、黑客和专业代码)相关的问题,以制定和支持良好的解决方案(如正确行为或正确价值观)”。
Data ethics as the branch of ethics, which studies and evaluates moral problems related to data (including generation, recording, curation, processing, dissemination, sharing and use), algorithms (including AI, artificial agents, machine learning and robots) and corresponding practices (including responsible innovation, programming, hacking and professional codes), in order to formulate and support morally good solutions (e.g. right conducts or right values).
事实上,Luciano Floridi 和 Mariarosaria Taddeo并非回答了“什么是数据伦理”这个问题,确切说,他们提出了数据伦理的适用范围。该定义也具有较大价值,解决了数据伦理规范的范围的问题,并指出数据伦理学解决数据本身、算法和应用三个主线的伦理问题,优先事项和重点不同。
但我们认为数据伦理的演进不应局限于宏观伦理范畴。虽然研究中确实可以从宏观伦理视角探讨数据伦理,但在数据治理原则框架下——特别是在管理与审查实践中应用时——其具体性和针对性会显著增强。从个人视角来看,数据伦理的三大维度更能体现其实际应用价值。说白了,这三大维度构成了数据伦理的核心框架与应用范围。
此外,一些定义式基于数据伦理原则,如“数据伦理学是指管理数据的收集、存储和分析的道德原则和指导方针,其涉及问题广泛,包括隐私、同意、透明度、公平性和问责制是指管理负责任的收集、处理和使用数据的原则和框架,以确保隐私、安全、公平、透明度和问责制”;这些我们在数据伦理原则中讨论。