欧洲议会研究局报告 | 数据治理与人工智能:探索数据治理新模式
2022年7月11日,欧洲议会研究局(European Parliamentary Research Service,简称“EPRS”)发布了名为《数据治理和人工智能:可持续和公正的数据治理模式》(Governing data and artificial intelligence for all: Models for sustainable and just data governance)的研究报告。该报告关注人工智能,旨在研究欧盟数据治理框架政策,并侧重于对欧盟数据治理战略进行总体评估和考虑。此外,报告提出了四个良好的数据治理基准:维护和加强公共基础设施和公共产品,包容性,可竞争性和问责机制以及全球责任。摘译 | 李朦朦/赛博研究院实习研究员
来源 | EPRS
当前的全球数据治理模式代表了技术领域最大参与者的利益,以及其所在经济体所属国家的利益。在这一愿景中,数据主要被概念化为一种资产,公民被概念化为数据供应商。数据以各种形式为那些有能力收集和管理数据的行动者创造巨大价值,通常没有得到有意义的同意。这意味着在获取各种形式的数据、控制其使用以及参与全球数字经济所带来的成本、收益和风险分配方面存在不平衡。
数据治理的主要概念基础
本节探讨了“数据作为国家战略资产”、“数据作为专有资产”以及“个人数据与非个人数据”这三个概念基础,并讨论了它们为数据治理提供的不同框架和配置。在数据治理中,有三种主要的总体框架:将数据归生产和管理数据的人所有;根据数据是否与个人有关进行分类;替代性框架。
对于已经建立数字经济的国家来说,可以访问数据的主体以及访问数据的目的具有政治和经济上的重要性。数据是控制和影响人口、监测国内外形势以及制定经济和政治战略的关键资源。各国都在小心地保护其对各种数据的控制权。斯诺登事件表明,即使在盟国之间,数据也是国内和国际监控的重要资源,数字权力已成为全球外交的核心议题,人们不断寻求新的网络监管规定以规范与互联网相关的权力和国家之间的数字侵略形式。这种寻求利益平衡的做法也不断体现在国家层面上,表现为数据和民主权力的监管一直在与最大限度地维护民众访问和控制个人数据权益的行动进行斗争。
也有国家和国际数据市场将数据视为与个人权利和债权相关的私人资产。如果个人获得其他权利的适当补偿,则数据既可以构成一种资本,也可以构成可以自由交易的商品。该观念是全球数字市场的基础,并且是全球层面数据治理主张的一个关键特征。
“数据即资产”模式催生了一种基于技术公司和其他大规模处理数据的行为者自我监管的数据治理愿景。在这种模式下,国际数据市场也为各国提供了机会,使其成为强大的数据交易中心。这种以资产为中心的数据治理模式得到了全球层面政策的支持,如G20、WTO86和其他国际组织(如贸发会议),都认为国际数据自由贸易是全球数据治理的核心优先事项,其他治理措施将围绕其展开。
一个多世纪以来,个人数据和非个人数据之间的区别与对隐私的思考同步发展,并且这种假设深深植根于大多数数据治理讨论中,以至于它往往变得不可见。但它却是嵌入数据治理模型和工具中的概念基础,没有它,许多主张就会变得失调。
目前,以市场为导向的数据治理模式都依赖于这样一个观念,即可以将数据划分为敏感个人数据(如果不限制再利用,可能会对人类产生重大的负面影响)、个人数据(数据与人有关并对人有影响,但在大多数情况下依旧可以共享和使用)以及非个人数据(与人无关,除了财产索赔,可以交易和再利用)。
数据治理模式的核心基准及其影响
欧盟的数据治理方法借鉴了一系列总体原则,用以定义良好的数据治理模式。其核心基准包括:维护和加强公共基础设施和公共产品、包容性、可竞争性和问责机制以及全球责任。
维护和加强公共基础设施和公共产品:治理模型提出的渠道收益是否主要面向公众?是否优先考虑公共基础设施和相关公共产品的完整性?
包容性:治理模式是将权利和价值观设想为普遍适用,还是优先考虑那些也是公民或在地理上接近数据管理机构的权利持有者?是否将非公民和世界其他地区的人(例如,进入或生活在欧盟的移民,或受欧盟公司数字贸易行为影响的其他地区的人)概念化为其所确立的价值和保护的相关社群?对权利和价值观的理解是否考虑到人们有不同的能力来要求这些权利和权益,并明确地考虑到这些社会政治背景?
可竞争性和问责机制:治理模式是否假设人们可能不同意、抵制、拒绝该模式并提出需要补救的索赔要求?是否有允许数据和技术政策对社会和政治变化做出反应的机制,该模式是否提供了识别和协商异议和争论的方法?该模式是否通过其提供的体制机制同民主问责制的原则和过程达成一致?
全球责任:治理模式是只着眼于内部,例如欧盟成员国,还是考虑到对全球、政治和经济领域的外部行为者的规范制定效果?
核心基准对良好的数据治理的影响:
1.维护和加强公共基础设施和公共产品
这个问题涉及到资源的公平分配以及保护公共(数字)基础设施的功能,而公共(数字)基础设施反过来又提供公共产品(包括社会安全网、科学知识、公共教育和医疗保健、诉诸司法、选举过程和执法)。在数字化过程中,如果这些公共产品被委托给非国家行为者可能面临风险,则应该集中讨论此类责任转移的过程和监管机制。
因此,建立一个数据治理模式也代表了对公共利益声明:它要求明确对公共服务应在多大程度上通过公共基础设施提供,以及“公共”在实践中(例如在透明度政策、监测机制和申诉补救渠道方面)意味着什么。建立一个数据治理模式也会影响到架构:它决定了谁有权构建直接影响公众的基础设施,这些基础设施是否以及如何对公众负责,公有系统应如何与私有系统交互,以及对谁有利。参与这种“公共性“也意味着要分辨出将数据作为商品的处理方式是如何导致其受到倾斜的市场力量的影响的,在这种情况下,少数处于主导地位的参与者为数据经济中的其他人制定了议程。建立一个公平的竞争环境,不仅需要确保某些功能保持公共性质,还需要确保其他行为者(如公民社会)依旧有能力挑战这些功能的公共性。
2.包容性
数据治理的包容性视角要求任何模型都以正义为中心,并考虑所有受其影响的人的利益。例如,在开发和部署数据分析和人工智能时,非公民、涉嫌犯罪或被认为存在安全风险的人以及社会福利计划的受益人等群体不能被忽视。一个良好的数据治理模式应交代清楚应重点关注的主体及他们为何重要,而不仅仅指出什么数据重要。
一个体现社会正义的数据治理模式,应增加与技术相关的脆弱性的概念化方法。除了认为如果特定人群是某些少数群体或具有敏感属性,那么他们更容易受到伤害这一要点之外,社会正义观还将为这些考虑因素增加另一个方面:权力和机构的不平等分配。从这个角度来看,数据技术和人工智能通常是以剥削的方式构建的,并且会加剧这些不平等。
3.可竞争性和问责机制
可竞争性和问责机制是数据治理模式的关键。与数据和人工智能系统有关的可竞争性有许多形式,其中一部分与民主问责机制的结构有关。有时,问责机制是公司或公共机构内部的,例如,与内容审核或不公平待遇有关。通常,这种问责机制需要与更广泛的政治和法律形式联系起来才有意义。不同背景下问责机制的标准如下:什么系统和数据正在被使用?什么主体在系统内做决定?谁对造成的损害负责?
问责机制的必要特征包括:首先,数据治理应被视为影响集体、当前有权提出权利主张的主体的问题。其次,考虑到数据治理的时间维度,干预或应用数据的阶段识别问题、确认权利主张的基础设施和程序很重要。第三,该系统必须提供平衡数据和人工智能干预前后差异的方法。除非人们在法律上、结构上和制度上被赋予权力,可以首先反对或不同意某一特定的技术应用,否则从他们那里获得的任何同意都是无效的。
可竞争性的最后一个方面是抵制市场和私人塑造数据治理优先事项权力的可能性。这在主流观点中可能显得相当激进,但依旧值得认真考虑。这个观点对为什么某些行动方案被市场参与者视为不相关、不切实际或不可行提出了疑问,并质疑市场在制定未来数据治理的愿景和条款方面的作用。数据正义的观点要求将可竞争性的概念扩大到基于竞争和消费者保护条例的要求之外。
4.全球责任
数据治理方面的全球责任并不是为世界不同地区提供构建数据治理框架的模板并进行移植的责任。欧盟已经在其数字战略中阐明,其全球责任不仅是因为立法的域外影响,而且还由于欧盟的监管方法经常很快就成为全球其他地区监管的标准。
数据治理的主流模式转化为全球不平等的再现,其中一群可识别的强大行为者控制着数据。例如,欧盟与其他国家之间的贸易协定历来都是以不公平的条件制定的。
因此,必须牢记欧洲以外的国家推广数据治理模式的影响,需要对当地的价值观进行多元化的理解。这包括承认数字经济中各方之间的权力不平衡,认识到为了确保公平的数据治理,需要将人们访问、使用数据基础设施的多种方式结合起来,并最终建立机制、设立机构以确保适当程序的灵活应用,并在不同国家背景下具有适配性。在考虑建立一个具有全球影响力的模式时,要超越特定管辖区典型的、狭隘的制度框架,审查这种模式在程序、实质和形式上可能产生的影响。
主流数据治理模式的替代方案
本节探讨了一些旨在挑战主流模式的假设的替代性数据治理模式,这些模式主要是概念证明或继续发展的试点。
公共数据信任
反对将数据作为一种商品以获取利润,提倡公共机构必须将数据作为一种公共资源来管理
该模式中,公共机构负责管理、访问、汇总和使用从不同来源收集的数据。数据主体和公共行为体之间的主要协议基于信任关系建立。这种模式的主要价值是体现公共利益,可以使用公共数据来制定政策、进行社会创新和解决社会挑战。
该模式是反主流模式而行之,主流模式将数据定义为一种应被开发以获得最大利润的商品。在这种情况下,数据被定义为公共利益基础设施。因此,公共机构也有可能与第三方共享数据,并签订强有力的协议,以保护公共利益、维持强有力的问责机制。
公共数据信任模式目前依旧以一系列试点为代表,尚未成为一个综合模式。该模式通过巴塞罗那在2018年推出的数字计划的努力得到普及。
数据协作
公共和私人公司通过使用独立的第三方机构来管理数据资源,从而产生公共利益
数据协作并不抵制主流模式,其可以被视为一种替代模式。该模式中,公司收集的私人数据通过独立的第三方与公共数据汇集在一起形成数据池。这些数据由第三方管理,数据访问、共享和使用仅限于合作关系的成员。该数据池主要用于有利于公共政策发展的项目,并赋予成员使用以前无法获得的数据的权利。数据协作通常采取公私合营的形式对数据的获取、共享和使用进行管理。数据协作比其他几个替代模式更发达,体现了主导模式的基本原则。
数据(半)共享
将某些类型的数据定义为“公共资源” ——这些数据由特定社群拥有,可以限制外部人员的访问
该模式可能意味着,特定的数据资源可以作为欧盟的共同财产进行管理,并能够通过中央管理流程授权对该数据资源不同程度的使用。
值得注意的是,与数据相关的共享资源有许多不同的方法。目前正在建设的欧盟数据治理架构正在加入一些公共资源的特征,例如在拟议立法文书中,将数据从企业引向政府。
私营部门及其代表倡导的数据治理模式,实际上倾向于使企业对具有公共价值的数据的所有权合法化,并通过将监管权集中于最强大的利益集团,加强对数据的不平等访问和控制权。
数据合作
反对以垄断性数据控制者为中心的主导模式,提出了一种数据主体集体管理数据的模式
该模式中,数据主体是主要参与者,通过特定群体或集体组织来组织数据的使用、共享和访问。这种模式的主要价值在于将公共利益转化为集体权益。在这种情况下,集体成员自愿提供数据。,并参与基于共享价值观的治理模式(包括限制使用、共享和获取集体数据的规范和程序)的构建。
该模式是对霸权式数据治理模式的回应。一方面,该模式回应了将数据视为市场商品观点。数据合作机构将数据定义为地区管理的公共资源。另一方面,数据合作机构旨在建立分散的自下而上治理模式,对自上而下的数据治理模式发起挑战,目的是解决霸权式的数据治理模式中的权力不平衡问题。
数据合作机构多种多样,利益范围从隐私和劳动到自治和可持续性等社会问题。最常见的数据合作模式之一旨在挑战平台的主导地位,并在成员之间公平分享其活动的利润。
原住民数据主权运动
将数据定义为本土资源,反对将数据治理作为殖民地民族国家事务
长期以来,殖民国家一直通过掌握原住民的数据对原住民的生活进行控制。在这种情况下,关于数据主权的争论是地区对其资源的长期斗争的一部分。在当前的数据治理模式中,原住民地区被剥夺了自主权,或者被迫依赖外部人员来访问和使用其数据。因此,原住民数据主权模式提倡根据原住民的法律、惯例和价值观管理有关其人民、领土、生活方式和自然资源的数据。
原住民数据主权模式的基础是《联合国原住民权利宣言》(UNDRIP),由联合国在2007年通过。该宣言规定了原住民地区福祉的最低要求。原住民数据主权运动目前还只是一种提议,尚未发展成成熟的治理模式。
个人数据主权
提倡数据主体应寻找单独控制其数据的可能性,以换取个人利益或个人自主权
该模式中,数据主体被定义为数据中介,旨在控制其数据的访问、使用和共享。数据主体对其市场内的数据有更多选择权,从而能够获得更多利益。个人数据主权模式的目标是促进对个人数据的更大化控制,并基于数据的控制为用户提供更好的服务。
个人数据主权模式正日益从一种政治意识提议转变为一套现实技术工具,旨在实现对个人数据的更大控制。区块链等加密技术的出现和自由主义价值观的兴起,激发起倡导者追求去中心化的技术系统、以实现 "自我主权身份"的行动。该模式的倡导者主张可以通过此模式来实现对关于个人数据的主张,而无需依靠国家机构等传统中介机构。
结论
在开发和使用方面,人工智能并不是一个民主的技术类别。大规模开发和部署人工智能系统是一项特权,该特权主要由社会中最强大的参与者(无论是商业部门还是公共部门)获得。除非运用大量的资源来对抗它,否则它将继续依赖大规模的商业计算基础设施,将分析和干预数据的权力输送给那些拥有最多资源和能力的人。
因此,本报告讨论的核心问题,是通过对人工智能系统及其所依赖的数据生态系统对数据所附权力进行分配,激励开发和部署数据系统的人进行良好的数据治理,以维护公共利益并创造公共价值。总体而言,本报告强调了社会团体集体意愿和决策的重要性,结合对公共价值的规范导向,提出了人工智能和数据治理的重要考虑因素。
CYBER RESEARCH INSTITUTE
声明:以上内容来源于网络,如有侵权请联系我们(123@shiyan.com)删除!
页:
[1]