数字经济发展与治理(第2辑)
上QQ阅读APP看书,第一时间看更新

数据要素、数字经济与数字治理

构建多层次数据要素市场

江小涓[1]

一、交易与交互双轨流通:数据要素异质性的突出表现与创新挑战

1.数据要素市场是中国数字经济发展中的原始制度创新

人类社会进入数字经济时代,数据成为基础性战略资源。如何看待和发挥数据的价值和重要性,成为国内外普遍关注的问题。党和政府敏锐看到这个趋势,将发挥数据要素作用问题放在决策与工作部署的重要位置。如图1所示,2004年,中办发布《关于加强信息资源开发利用工作的若干意见》,提出信息资源作为生产要素、无形资产和社会财富,在经济社会资源结构中具有不可替代的地位。2019年中央十九届四中全会提出“数据可作为生产要素按贡献参与分配”,明确了数据要素市场这个重要概念。2022年6月,中央全面深化改革委员会审议通过《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”),部署了数据要素基础制度“四梁八柱”,开启了数据要素市场建设发展的新征程。2024年1月,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,推动数据要素高水平应用,数据要素市场建设从理念形成进入实践探索阶段。

图1 中央高度重视发挥数据的重要作用

虽然数据的流通使用和治理引起各国的普遍关注,但我国是首个明确将数据列为生产要素的国家。我国市场体制建设和要素市场发展,借鉴吸收了国外许多成熟的经验。数据要素市场建设是我国的“原始创新”,从头起步探索前行,是典型的制度创新,因此“数据二十条”定位于探讨数据要素市场基础制度架构,勾画出产权制度、交易制度、分配制度和治理制度四个方面的制度框架,如图2所示。总体看,其思路和逻辑基本遵循了其他生产要素市场的基本框架。

图2 中国数据基础制度的“四梁八柱”

2.数据的独特性质和创新的挑战与机遇

数据作为生产要素有其独特性质,确权、生产、流通和治理几个方面,都有与其他要素相似的方面,也有自身独特的性质,主要体现在以下几个方面,如图3所示。第一是多主体生产因而确权困难,数据的生成过程错综复杂,常常是多方主体相互协作的结果,包含了不同主体、不同程度的投入和贡献,因此确权困难。第二是多场景复用方便,一组数据可以被不同主体以不同方式重复利用,在使用上不具有竞争性和排他性,不易清晰明确主张权力。第三是数据中的敏感信息多,许多数据的内容多层次多元化,可能承载了需要保护的个人信息和商业机密,即使匿名化和去标识化,也有可能在新技术条件或与其他数据汇聚后被挖掘出来。第四是减损贬值快,绝大部分数据的价值在于实时性,有研究表明一年期以上的数据贬值达到98%以上,保值增值十分困难。第五是数据的交易和交互,这一点将在下文详细讨论。

图3 数据的独特性质

由于数据的许多特殊性质,数据要素市场制度建设必然会碰到许多新问题。因此,在基本制度架构的基础上,理论与实践创新都应该是开放式的,许多具体规则和模式都需要在理论指引和实践经验的基础上不断探索发展,架构本身也很可能需要不断修改与完善。例如“数据二十条”考虑了所有权,但更强调持有权、使用权、经营权,让数据先动起来、用起来,就是回应了现阶段中国特色数据产权制度的一个鲜明特点。

3.交易还是交互:数据要素市场的一个特殊重要问题

在一般要素市场中,要素的确权和交易是要素流通使用的基本前提。然而数据要素的流通使用有交易和交互两种方式。交互型流动,即数据在不同主体间的非交易型流通使用,这种方式具有独特性质。因此,理解和处理好数据交易和数据交互这两种流通使用方式,是数据要素市场建设中理论性和实践性都很强的重要问题。下面我们从商业数据、公有数据和跨境数据三个方面,分析数据交易与数据交互的不同性质,以及这两种方式并存对数据要素市场建设产生的影响和未来市场建设中制度创新的重点方向。

二、数据交互与数据交易收益:商业数据流通使用的两条主线

“数据二十条”发布后,数据要素市场建设最显著的进展就是各类数据交易所建设的快速发展。与此同时,对数据流动最普遍的一个认识偏差是忽视数据交互这种流通和使用方式。数据流动与其他要素流通的一个显著差异是数据并非必须经过确权、定价和交易后才能流通和使用。通过数据交互方式拉通全产业链全生态圈的业务、相关各方共同拓展新赛道和分享新收益,是当下数据流动和发挥作用的主要形态。

1.场内数据交易:当下高度受重视的制度建设

建设数据交易所是我国数据要素市场建设中各个地方用力的重点。其中一个显著特点是,“数据二十条”发布后,各地发展热情更加高涨,数据交易所快速增加,到2023年10月底已经超过48家。从各地数据交易所的工作推进情况看,总体上是制度建设和规则建构先行,高频推进的工作包括登记、确权发证(持有权、使用权、经营权)、价值评估、公共数据开放和运营、数据链建设、数据产品合规体系和数据安全体系建设等,以及从数据、数据产品到数据资产、数据资产金融创新的路径指引等。同时,交易所的各类主体汇聚也取得明显效果,在几家主要的数据交易所中,已经入场的各类主体都超过千家,包括数据供给方、数据需求方、多种类型数据服务商和数据安全技术开发主体等。不过总体上看,“场内”数据交易量有限,可以说仍在尝试起步阶段。

没有交易发生甚至没有场内数据交易意愿的主体为何“入场”?首先是数据交易所的信息平台作用突出。如图4所示,数据交易所的基本架构能够促进相关主体之间的充分交流,构建良性互动、开放协作的产业生态,共同推动相关制度建设。在此共性意愿下,各类主体有各自立场。数据拥有方希望在确权的基础上能交易数据并获得收益,在交易不活跃时,也期待数据能够被确权、评估和入表,成为数据资产。据介绍,我国数据交易所当下业务主要包括数据资产登记、评估、发放资产凭证、数据资产入表、数据资产金融创新、数据资产交易,如图5所示。“数据资产”可以增加企业信誉和改善资产负债表。不过最有共识的期待是数据资产可以用来融资,例如数据质押贷款、数据资产担保和数据资产证券化等。从目前情况看,金融业较为普遍地认为数据资产带来的挑战和机遇都很大,需要积极谨慎研究,试点探索先行。这种想法可以理解,例如一笔估值数千万的“数据资产”用于抵押贷款,如果到期不能还款,而用于抵押的“数据资产”又迅速贬值,风险如何控制的问题还需要实践探索。对数据服务商来说,能在数据交易所得到某种方式的增信,并预期能为交易所中的各类主体提供服务,是其“入场”的重要动力。当然,先行进入获得信息得到增信,并期待在未来海量数据交易中抓住先机,是所有主体的共同愿望。

图4 数据交易所的基本架构

图5 数据交易所对当下业务类型表达的基本架构

2.场外数据交易前景广阔

场外数据交易是指数据需求方与数据拥有方直接交易,两类场景最常见。一类场景是经济社会的“智能化转型”,这类转型的本质是将物理场景数据化,并使两者有效协同。智能化转型的市场有多大,智能化转型服务的市场就有多大。有些企业采用专业数据生产商提供的数据库或数据组件,有些企业购买数字化转型解决方案或各种形式多样的转型服务。另一类场景是解决数据无法流通时的数据共享问题。由于隐私保护或其他政策限制或竞争关系,一些领域的数据无法汇聚或拉通,数据服务商提供联邦数据和计算解决方案,私有化部署,数据不动算法动,这为各种数据技术服务商提供了商机。由于技术持续升级,该服务需求量大而且不断迭代升级,发展前景远大,不过从技术类型和交易规模看,数据交易所这类交易平台在发挥品质保障、信用保障、金融服务和撮合交易等作用方面有很好的发展前景。

3.场外数据交互:多种场景拉通支撑业务扩展

数据的交互利用是当前数据流通更为广泛使用的商业模式。数据或数据产品并非用来直接“交易”获利,而是为了业务发展。也就是企业和组织通过与内部各方以及与业务相关的外部各方共享数据,支撑业务打通和创造新价值,各方共享业务发展带来的利益。数据交互的主流模式是API模式,即通过应用程序接口拉通数据。这种模式允许不同的应用程序或系统之间进行数据交换和集成,实现数据流通和共享。API模式在数据流通中的应用非常广泛,它可以帮助实现数据共享、数据交换、数据迁移、数据同步等功能。在API模式下,并没有“数据交易”发生,因此数据持有方并没有确权、估值、入表和交易规则等服务需求,而需要解决数据交互中的匿名化标准、隐私保护责任边界、数据跨界跨境流动、数据安全技术开发、大企业数据垄断等问题。下面我们分别探讨各类平台的数据交互情况。

首先是消费平台。数据主要用于全链条业务和跨界业务打通(数据交互)而非数据交易。例如跨境电商平台有海量实时数据,为平台国国内外客户和商户服务,打通全链条数据交互,从消费者偏好感知、智能广告推送、获得客户订单、生产者排产制造、商户发货、物流体系配送,直到商品交付给消费者,这个运作全链条的数据拉通,支持平台全球业务发展和生态圈的不断拓展。再如银行数据主要用于风险管控、识别客户、推送服务以及各种衍生服务圈的开拓,而不会通过确权-交易这种方式来流通利用。

其次是产业互联网平台。产业互联网的初心就是通过数据交互支持产业链从供应端到客户端各个环节的业务衔接和融通,提高产业全链运行效率。另一类产业平台是复杂场景下全域数据的拉通,例如全过程智能电网建设、智慧城市建设中多场景数据的汇聚和应用。在这两种情形下,平台有可能将行业、领域知识与经验进行数字化封装,提供优秀的服务组件,适应特定企业和特定场景的应用需要。但此时的供需双方可以直接沟通,而且交易的是数字产品而不是数据要素。

最后是通用人工智能模型应用。无论是搜索平台通过人工智能实现极高匹配度的内容分发和信息输出、内容平台实现极为丰富的智能化内容生成、社交平台实现人机极高效率交互,还是人工智能模型在垂直领域的落地应用,都很难想象训练模型所需的多模态海量数据是经过确权后的数据交易这种方式获得的,实践中更多的是用海量交互方式或者网络抓取方式获取数据。

三、数据交互提供服务与数据开发收益:公共数据使用的两条主线

1.公共数据以交互方式提供大量数字化公共服务

政府和各类公共部门及公有企事业单位生产存储大量数据,而且是高质量数据。在现实中,普遍服务类型的公共数据主要通过两种数据交互方式提供服务。一是政府部门与公众和市场主体的交互,例如各级政府及其部门为市场主体和公民提供的数字化服务,就是前台与公民和市场主体的信息交互,以及全流程中政府各部门之间的数据交互过程。二是中央到地方的政府服务平台,纵向层级间数据与横向地方间数据的交互贯通,为公众提供异地或跨层级的数字化服务。

我国国家政务服务平台是全国政务服务平台的总枢纽,通过跨地区、跨部门、跨层级的数据交互和业务协同,依托全国一体化政务服务平台统一身份认证、统一服务事项、统一证照互认、统一数据共享等支撑能力,后台汇聚了超过10亿个实名注册用户的数据、5 981个各级政务部门的数据、258万项地方部门涉企办事服务数据;前台发布各类数据资源1.5万类,支撑政务数据共享调用超5 000亿次。根据《数字中国发展报告(2022年)》,截至2022年底,全国一体化政务数据共享枢纽直通地方部门500万余项政务服务事项的数字化办理,“跨省通办”服务已接入近100个可网上办理的高频“跨省通办”事项和近200项可跨省办理的便民服务;32个省级政务服务平台“一网通办”服务为广大市场主体提供了企业登记、公章刻制、申领发票和税控设备、员工参保登记、住房公积金企业缴存登记等企业全生命周期的数字化公共服务。

图6 公共数据在政府不同层级不同地域之间交互拉通,为公民和社会主体提供数字化公共服务

2.公共数据的有偿开发利用也多采取交互方式

公共数据涉及政府治理对象,含有大量个人信息、商业秘密和公共安全信息。因此,在开发公共数据为产业提供有偿服务时,需要数据可用不可见。在这种情况下,如图7所示,政府建立公共数据专区,汇聚政府各部门掌握的多种类型数据,需要了解市场主体信用状况的机构如金融机构可以进入专区获取相关结果,数据不出域,可用不可见,既能助力信用良好的企业获得金融服务,又能保护企业相关商业秘密和个人信息。

另一类普遍应用的公共数据交互是智慧城市建设,交互的目的既有公共服务也有商业化服务。智慧城市建设运用物联网、云计算、大数据、空间地理信息集成等新一代信息技术,以交互方式接通城市各条线的数据,服务城市运转和管理。智慧城市建设涉及政府、企业、公众等多个角色,政府引导、市场主导、公众参与的模式逐步形成,建设主体呈现多元化。政府积极鼓励和引导社会资本参与智慧城市建设,吸引了ICT(信息与通信技术)设备供应商、电信运营商、系统集成商、软件开发商、互联网、金融、房地产等企业纷纷入局。据一些城市数据测算,智慧城市各级政府财政支出约占五分之一到四分之一,其余为社会投资。因此,智慧城市的建设和发展提供的应用场景,既有智慧政务、智慧交通、智慧应急等公共服务,也可以为事业发展和产业发展提供特定的公共服务,如智慧医疗、智慧物流、智慧安防、智慧企业等。

图7 政府公共数据设立专区,以数据可用不可见不可流出的方式,为市场提供市场主体信用服务

公共数据也存在有条件交易使用方式,这是公共品“用户付费”方式在数字时代的表现。例如有些公共数据并不被广大公民和市场主体所需要,政府无须用财政资金为特定用户提供相关服务,而由相关企业按照自身运营需要付费获得。

这里需要强调的是,公共数据要以为社会提供数字化公共服务为首要目标。目前多个省市都成立了公共数据服务专业机构,统筹公共数据的开放共享和开发利用。要坚持以政务数据开放共享为原则,同时允许多种形态的探索创新,使更多数据得到有效使用。

四、数据交互拓展全球业务与数据交易获得分工利益:数据跨境流动的两条主线

1.数据跨境交互拓展全球业务

数据跨境流动的主体是跨国运营的企业和组织,目前数据交互是主要模式。数据跨境流动的目的是通过企业内部以及相关业务生态内各方的数据交互,拉通全球业务链和统筹全球业务运行。数字时代的每一笔国际贸易都依赖数据跨境流动,跨境电商离不开实时海量的数据跨境流动。阿里速卖通、Shein(希音)、Temu(即拼多多海外版)等一批全球性数字平台企业,通过数据交互,联通我国上万家中小微制造业企业与海外市场,高效组织供应链,带动数以万计的中小微企业以数字化方式进入国际市场。全球供应链管理服务企业基于客户全球运营的需求,向运营各个环节实时提供运输、仓储、包装、搬运装卸、生产等过程中的多维度数字化信息,通过高质量的全球数据链和先进的人工智能算法为货主和物流服务商提供高水平供应链管理能力。数据跨境交互流动还促进了可数字化交付的数字服务贸易增长,拓展了数字广告、数字营销、数字音乐、数字视频、游戏、动漫、软件研发、远程医疗、在线教育等数字服务贸易发展。再如金融理财机构因业务发展需要,需将一部分国内业务数据与研究成果融入全球化研究体系,以便使用全球视野的研究资源和分析系统等,来支撑业务发展。还有民航业数据的跨境流动,是为了支持世界各地旅行者从乘机决策、机票购买、值机候机、登机服务、到达行李全流程业务的拉通。从业务拓展看,希望能通过数据交互,将业务拓展到与乘机人旅行目的相关的服务领域中,例如教育消费、医疗消费、旅行消费、文化消费、商品消费以及金融服务等领域。在上述各类数据跨境流动中,数据都是通过交互拉通全链业务和拓展新的业务,而不是直接进行数据跨境交易。

2.数据跨境交易并获利

数据跨境交易的某些业务与国内场外交易类型相似,包括为国外有智能化转型需求的企业提供数据服务、当数据出于隐私或安全跨境流通需要时提供数据计算结果服务等。跨境数据交易也有独特的内容,例如来数加工业务和离岸数据外包业务。来数加工是指在中国境内对来自境外的数据进行加工处理的行为,类似于较早时期的产品型加工贸易,这种行为必然涉及数据的跨境传输。离岸数据外包是指企业将内部数据处理相关的业务流程以商业的形式发包给位于海外的服务提供者,通常是为了利用国外相对廉价的劳动力或专业知识。中国从事这两类业务具有优势,一是我们许多数据服务商的技术能力和商业模式具有较强竞争力,能为海外客户提供更好的服务;二是我们有较低的劳动力成本,在劳动密集型数据行业中具有较强竞争力。因此,我们在全球数据跨境交易中应该占据重要地位。

3.数据跨境流动治理模式:以合规流通为出发点

对跨境流动数据进行管控是各国的共同做法。我们目前主要采用发布规则并逐单核准的模式。这种方式有利于数据跨境流动安全,但对政府和企业来说负担很重且效率很低。从国际经验和我国一些数据交易机构的实践看,需要将审核企业数据合规能力和审核数据内容合规性相结合。当下常用的有以下几种治理类型。

第一,审核企业数据保护的合规能力。美国主张通过行业自律实现跨境数据自由流动。企业制定隐私政策的标准,最具代表性的为ISO/IEC29100系列标准,包括《隐私保护框架》《隐私体系框架》《隐私能力保护评估模型》《隐私影响评估》《个人可识别信息保护指南》等。但跨境数据流动涉及双方或多方,因此美国大力推动APEC(亚太地区经济合作组织)采用跨境隐私规则体系(Cross Border Privacy Rules, CBPRs),这个体系强调“数据持有者标准”,这是一种企业数据合规能力标准。CBPRs体系是一项企业和各类组织自愿认证的体系,通过认证后,认证企业内部和企业之间个人信息的跨境传输应不受阻碍。

第二,制定白名单。欧盟执行的是白名单管理制度。CBPRs的本质也是白名单,但主要针对企业和各类组织。而欧盟的白名单指经过欧盟评估认定的对个人数据保护充分的国家、地区或国际组织,如果达到要求就可以直接向其传输数据,不必采取进一步的保护措施,其评估的主要内容是对个人隐私的保护。目前欧盟确认安道尔、阿根廷、加拿大、以色列、日本、新西兰、瑞士、英国和乌拉圭等国家和地区获得白名单资格。

第三,制定标准合同(Standard Contractual Clause, SCC)。如果一个国家或地区不在欧盟认定的个人数据得到充分保护的白名单中,此时企业传输个人数据则需要采取其他豁免途径,如签订标准合同、约束性企业规则、获得数据主体同意等。其中标准合同应用最广泛。标准合同要求明确个人信息被传输的方式和途径,个人信息被传输的地点、接收方和用途,个人信息被传输的合法性和安全性保障措施,出现违规行为的责任追究机制等。

第四,制定负面清单。美国2010年界定的“重要数据”范围包括农业、受控技术信息、关键基础设施、地理产品信息、情报、核、隐私、安全法案信息等17个门类。这些数据特别是受控技术信息出境要受到数据安全审查。审查内容和程序则依据相关法案,如《外国投资风险评估现代化法案》《出口管制条例》等。

无论哪种审查方式,都不涉及“数据交易的合规性”,而只针对“数据跨境流动的合规性”。其实践背景就是数据跨境流动主要是跨国企业集团内部数据流通,以及跨国经营企业在其全球产业链条和产业生态内的数据流通,主要是数据跨境交互而不是交易。我国数据跨境流动的商业模式和监管制度,要深刻理解这个实践背景,从我国实际出发,参考借鉴其他国家经验,持续创新和完善。

总之,数据要素市场是一种新型要素市场,我们进行的是原始创新。探索中的试错和反复难以避免,鼓励创新和容错纠错机制十分重要。要不断研究探索合理可持续的制度模式,让数据要素的价值充分发挥,支撑数字经济和数字社会的健康发展。


[1] 江小涓,中国工业经济学会会长,中国社会科学院大学教授。