【理论探索】沈坤荣 林剑威:数据垄断问题研究进展
【理论探索】沈坤荣 林剑威:数据垄断问题研究进展
在数字经济时代,数据要素在经济发展中的作用日益凸显,但是,数据垄断问题制约了数据要素价值的释放。本文首先探讨了数据垄断的内涵,然后从数据要素本身的特性出发分析数据垄断问题的成因,并从宏观经济效率和微观用户福利两个方面综述数据垄断带来的负面影响。之后,本文从数据共享、用户数据使用限制、数据可携带权与用户数据可迁移性三个方面,重点分析当前主要的数据垄断治理方式及政策。最后,本文总结并提出了数据垄断治理研究的未来可拓展方向,以期为我国加快构建数据基础制度、完善数据治理的相关研究和政策实践提供有益启示。
沈坤荣,南京大学商学院教授;
林剑威,南京大学商学院。
加强平台反垄断和数据治理已成为全球共识。依靠数据制度安排来治理当前的平台垄断问题,以及通过数据制度的建设在“事前”规避垄断问题的出现,是当前全球各主要国家的反垄断与数据治理的重要内容之一。我国2022年12月出台的《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》也明确指出要打破数据垄断,促进公平竞争。
国内外学界对数据造成的垄断问题展开了一系列研究。在充分借鉴吸收国外相关成果的基础上,针对我国数字经济发展的具体国情开展深入研究,探索数据垄断治理的中国方案,有利于我国充分利用在数据资源上的大国优势、在数据应用场景上的先行优势,加快实现数字经济高质量发展。基于此,本文系统梳理和归纳了现有国外文献关于数据垄断问题的研究进展,重点总结和评述对于数据垄断问题的治理方法,并展望未来可能的研究方向,以期能够为学界深化该领域的研究和有关部门完善数据治理的具体实践提供有益参考。
一、数据垄断的内涵
一般而言,大企业或大平台在数据、资本、技术等方面均占有优势,但随着数据作为一种生产要素在经济活动中的作用逐渐凸显,数据在成为企业的重要资产的同时,也日益成为大企业或大平台的市场垄断势力的重要来源(Veldkamp,2023)。已有一些文献讨论了数据与市场结构的关系,实证检验结果证实了数据在推动形成垄断性市场结构中的作用。Crouzet & Eberly (2019)研究发现,以数据、软件等为主的无形资本的增长是由行业领导者即大企业所推动的,行业集中度的提高和这些无形资本的上升有关。Tambe et al.(2020)研究发现,自20世纪90年代以来,数字资本在企业当中的积累十分不平衡,主要集中在小部分的“超级明星公司”(superstar firms)中,并且数字资本的集中度远远高于其他资产。Autor et al. (2020)基于美国1982年以来的经济普查微观数据研究发现,正是在数据和数据技术上的无形资本的优势催生了超级明星公司,从而造成了行业集中度的显著上升。
尽管数据已经成为市场垄断势力的重要来源,但大企业或大平台对于数据资源的独占或垄断是否就是“数据垄断”,在理论上存在一些争议。一方面,企业对于数据资源的独占可能是合理的。从生产过程上看,与其他生产要素一样,企业必须先占有数据,才能使用数据,进而发挥数据的生产力价值。企业需要在数据的收集、记录、存储等方面进行投资才能获得数据,企业为数据的生成支付了对价,从而应该享有相应的数据占有与使用的权利。另一方面,企业对数据资源的独占可能是效率的体现和要求。Autor et al. (2020)研究发现,行业集中度上升的行业也是创新速度最快的行业。一些企业最初凭借其创新能力和效率,通过合法竞争而获得大量市场份额和数据资源,只是一旦获得主导地位,就会反过来利用数据资源建立各种壁垒。因此,垄断企业对数据资源的独占可能是其卓越能力的体现和结果。并且,由于数据开发利用的规模经济效应以及网络效应,大企业对数据资源的占有可能更有利于发挥数据的价值。因此,大企业或大平台对数据资源的独占并不一定构成需要对其进行反垄断治理的充分条件。
对于数据垄断的认定,一些文献将重点放在平台如何利用数据达成或强化市场支配地位方面,当平台利用数据维护和强化其市场垄断时,即构成“数据垄断”。市场份额或市场集中度、超额利润常常被视为认定企业是否具有市场支配地位的重要因素。但是,从市场份额的角度来看,数字经济中存在明显的网络效应,这往往会造成“赢家通吃”的局面,使得数字经济中的市场集中度更高,数字平台也天然具有垄断特性,因此,较高的市场份额可能恰好是市场均衡的结果,而并不一定代表平台具有垄断势力(Tirole,2023)。从利润的角度来看,当前的收入和利润可能难以捕捉平台在数字经济中的市场竞争优势。Veldkamp(2023)认为,数字经济催生了许多新的商业模式,使货币收入无法准确揭示企业正在产生和积累的价值,例如优步(Uber)和亚马逊(Amazon)一类的数据密集型企业都亏损多年,而这些企业积累的数据资产才是真正有价值的。这些设法积累数据并将其货币化的企业可以在后续获得市场主导地位,并利用这一地位提取垄断租金。因此,在平台经济当中,以市场份额和利润判断企业是否利用数据形成了市场垄断,需要更为慎重的具体考量。
沿袭双边市场理论的建立和发展,已有研究对于平台垄断市场势力的认定和分析不仅仅只考虑市场份额或垄断利润,对于企业垄断行为的分析也不仅仅只是局限于价格和产量,而是纳入更多的非价格效应。Khan (2017)分析了亚马逊的商业战略及其形成垄断地位的条件和影响,认为不能仅仅以价格和产量来衡量亚马逊的主导地位对市场竞争的损害,需要进一步关注平台会利用收集到的数据来削弱竞争对手的地位。Bamberger (2017)以打车平台优步为例直接提出了认定平台是否构成垄断需要考虑的几个问题,从数据的角度看,包括是否利用数据优势建立市场竞争壁垒,是否利用数据不公平地在其他市场建立主导地位,是否利用数据建立价格歧视、价格合谋、掠夺性定价,是否限制消费者的隐私权利等。Khan (2018)分析了平台市场势力的来源,认为平台的市场势力具备多种形式,包括平台基于对数据的占有对其他竞争企业进行限制、将主导地位拓展至其他市场、利用收集的用户数据强化消费者对平台的依赖等。Van Dijck (2019)认为,消费者剩余的概念不足以解释平台垄断势力对用户的影响,对于平台垄断势力的分析既需要考虑歧视性定价等对消费者剩余的短期影响,也需要考虑对用户隐私等方面的潜在的长期后果。可见,当前已有研究主要关注平台的垄断势力对市场竞争和用户福利的影响,对于“数据垄断”的认定也主要集中于垄断平台如何利用数据优势排斥市场竞争、降低用户福利。
综合已有文献相关研究,可以界定数据垄断的内涵:数据垄断不仅仅是“数据占有的垄断”,更多的是企业或平台“基于数据的垄断”,即利用数据资源占有或垄断的优势,以数据作为其维护和强化市场垄断地位、获取垄断利润的工具。当企业或平台的数据垄断由于排斥市场竞争造成经济效率下降、造成用户福利损失时,数据垄断就成为需要治理的数据垄断“问题”。此时,有关政府机构就具有对其进行相应的反垄断规制和治理的必要性及法理性。
学界的相关研究也已将考虑和分析企业或平台垄断问题的视角深入数据维度。诸多研究直接从数据本身及其特性出发分析数字企业或平台如何利用数据形成或强化市场垄断势力,从而导致经济效率下降和用户福利损失等问题;在此基础上,进一步分析对数据的共享、交易和权利分配等制度性安排如何影响企业和用户决策,从而规制和避免数据垄断。后文将从数据本身的特性出发,具体综述数据垄断的成因及影响,并重点综述数据垄断治理手段的有效性和利弊。
二、数据垄断的成因与影响
(一)数据垄断的成因
数据如何导致市场垄断问题的出现或者加剧市场垄断问题?从最新的相关研究来看,主要可以从以下几个方面进行归纳。
- 数据成为市场进入的壁垒。
这一成因主要与数据要素的特性——内生生成性(endogenous generation)有关。Cong et al.(2021)指出,数据的内生生成特征是将其与劳动和资本区别开的关键特征之一。数据的内生生成性指的是数据属于经济活动的“副产品”(by-products),只要有经济活动,就有数据产生,经济活动越多,可产生的数据也就越多。具体地,在将数据纳入数理模型分析的诸多文献当中即表现为,企业所拥有的数据量是其产量或者用户数量的增函数。这意味着,拥有较大市场份额的大企业基于其产量规模和用户规模可以生成和掌握更多的数据资源。因此,如果数据是企业的必要或重要的投入要素,新进入企业由于缺乏数据资源,将难以同在位企业竞争。Calvano & Polo (2021)指出,数据构成了垄断企业的“在位优势”,在位企业的数据基础成为其他企业进入市场所必须支付的高昂的“固定成本”,这可能会阻止其他企业进入市场。Tirole (2023)直接指出,正是因为谷歌(Google)和Facebook可以访问其他人无法访问的大量数据,这使得其在搜索和广告展示方面占据主导地位,诸多企业一开始就会放弃进入该市场进行竞争。
- 数据强化垄断企业的优势。
既有研究表明,企业掌握数据资源并基于此进行数据挖掘和分析,形成“数据驱动决策”(data-driven decision-making),可以优化企业的生产和管理流程,降低成本,提高生产率。特别是,数据愈发成为支撑创新活动的核心要素,推动创新活动加速数字化,可以显著促进企业创新能力和创新水平的提升。但是,一方面,数据的内生生成特征意味着原本占据较大市场份额的大企业拥有更多的数据资源;另一方面,大企业在数据分析能力、数字工具运用方面的能力都更强,相对于小企业,大企业将从数据中获得更大的好处。
因此,数据的作用在大企业和小企业之间是不对称的,而这将进一步强化大企业的优势,扩大企业之间的差距,推动大企业形成更强的市场势力。Begenau et al. (2018)构建了一个企业博弈模型,考察了在金融市场中数据如何推动大企业发展壮大。大企业不仅比小企业更擅长利用金融市场中的数据来降低资本成本,而且在融资过程中,由于大企业有更多的经济活动和更长的历史,产生了更多的数据,这使得外部投资者能够基于数据分析更好地对大企业进行预测,从而使大企业的投资不确定性和投资成本相比小企业更低,即大企业和小企业之间的风险溢价差距扩大了,这对于大企业而言,意味着数据要素使得其融资成本下降更多,因此,大企业能够在金融市场中占据优势,大企业变得越来越大。Eeckhout & Veldkamp (2022)也在模型中刻画了企业对数据的使用如何创造市场势力,数据的规模经济效应使数据丰富的企业能够以更低的边际成本和更大的规模组织生产,大企业可以将生产配置到消费者想要的商品上,从而获得更高的价格加成。
更为重要的是,数据的开发利用具有自我强化的特征。企业对数据的开发利用可以改善用户体验或提高产品质量,企业有了更好的产品可以吸引更多的用户或现有用户更多使用,从而获取到更多的数据,这又可以反过来进一步优化产品,从而形成一个自我强化的循环,Hagiu & Wright(2021)将这个自我强化的循环过程称之为“数据支持学习”(data-enabled learning)的过程。Farboodi & Veldkamp (2022)在纳入数据要素的内生增长模型中刻画了数据的这一特征如何导致和加速企业规模的分化。拥有更多数据的大企业更具生产力,从而将有更多的生产和交易活动,而这又创造出更多的数据,并进一步提高大企业的生产力和数据生成,形成“数据反馈循环”(data feedback loop)。这种数据的递增收益会使那些数据拥有量低的企业、行业或国家长期局限于少量的生产和交易,从而无法取得进一步发展。因此,数据将进一步放大企业之间的差距,使得原本的垄断企业和平台保持或进一步强化其市场支配地位。Prüfer&Schottmüller (2022)进一步在模型中考虑了多市场结构,并提出“关联市场”的概念,即数据所揭示的用户信息可能具有通用性,数据不仅可以降低企业在某个市场的创新成本,也可以降低与该市场相近或相似的“关联市场”的创新成本。因此,拥有大量关于用户偏好和特征数据的大企业在这些关联市场上也具有竞争优势,如果市场进入成本不高,能够找到“数据驱动的商业模式”的大企业,在长期内几乎可以主导任何市场。
- 数据成为垄断平台实施垄断行为的工具。
垄断平台可能会依靠在数据资源和数据运用能力上的优势实施各种基于大数据的垄断行为,主要表现在两个方面:一方面,数据成为垄断平台获取超额垄断利润的工具。利用大数据技术,平台可以从数据中推断出关于消费者偏好的相关信息,从而进行价格歧视。不仅如此,垄断平台还可以利用个人数据和人工智能技术操纵消费者支付更高的价格)。Van Loo & Aggarwal(2023)对亚马逊看似拥有垄断权力却向消费者收取低价的“悖论”进行了详细分析,揭示了该公司如何利用其复杂的算法和庞大的数据集来建立一个令消费者“误解”的市场。比如,亚马逊可能一直在以低廉、有竞争力的价格提供许多产品,但通过利用消费者的行为偏见,亚马逊可以让大量消费者永远找不到这些低价产品,消费者在亚马逊上购物可能会支付更高的价格。可见,利用数据和数字技术,垄断平台可以实施更为多样的攫取超额利润的垄断行为。