1.1.1 2024-2028年中国数据治理行业影响因素分析
一、有利因素
(一)国家政策支持
2023年2月27日中共中央、国务院印发《数字中国建设整体布局规划》。《规划》指出,要优化数字化发展环境,建设公平规范的数字治理生态。构建技术标准体系,编制数字化标准工作指南,加快制定修订各行业数字化转型、产业交叉融合发展等应用标准。提升治理水平,健全网络综合治理体系,提升全方位多维度综合治理能力。
2023年8月21日,财政部印发《企业数据资源相关会计处理暂行规定》,自2024年1月1日起施行。《暂行规定》提到,“数据入表”将规范企业数据资源相关会计处理,强化相关会计信息披露,服务数字经济治理体系建设。
2023年12月15日,国家数据局印发《“数据要素×”三年行动计划(2024-2026年)》。《行动计划》提出,要加强数据安全保障,落实数据安全法规制度,建立健全数据安全治理体系,完善数据分类分级保护制度,加强个人信息保护,提升数据安全保障水平。培育数据安全服务,鼓励有实力的数据安全企业,发挥能力优势,开展基于云端的安全服务,有效提升数据安全水平。
(二)数据治理与AI应用融合
数据规模的指数级增长给数据治理工作带来巨大压力,传统人工方式做数据的清洗、分辨与调优使治理工作耗时冗长,带来高昂的人力成本,且愈发难以满足智能应用对数据在规模量与质量的高要求,传统的人工数据治理工作已变得捉襟见肘。如今,人工智能和RPA等技术手段已被逐渐应用于数据治理的模型管理、质量管理、资产管理、元数据管理等模块,最终实现数据系统的“自治与自我进化”。受数据平台服务、数据治理服务和AI应用建设的需求推动影响,面向人工智能的数据治理市场规模将持续上升,从发展进程来看,中国数据治理与面向人工智能的数据治理市场规模增长均处于良性区间,共同巩固相关治理产业生态圈的向好形势。
(三)国家数据局成立推动数据治理行业发展
在数字化的大潮中,数据不仅是沟通世界的语言,也是推动未来发展的引擎。2023年10月25日,随着国家数据局的成立,中国在全球数据治理舞台上迈出了决定性的一步。国家数据局的成立不仅是国家对数据治理重要性的认可,更是对数据管理专业人才能力的高标准要求。在如今信息爆炸的时代,数据不仅要采集,更要合规地管理和智能地运用。随着国家数据局的成立,未来我国数字经济的蓝图日益清晰,数据管理与治理已成为企业和个人不可忽视的关键技能,数据管理与治理人员将掌握一系列关键技能,进一步符合目前数字化时代的治理要求。(四)基于区块链实现数据治理
区块链本质上是一种去中心化的分布式数据库,在增加大数据价值实现过程的透明性方面具有天然的优势,为解决当前数据治理的关键问题提供了可行性。
1、支持审计的数据存储和处理
数据决策渗透在人们生产、生活的方方面面,由于涉及多方利益相关者,数据在存储、处理和共享流通等过程中存在数据被篡改、数据伪造,以及不同来源数据的类型和标准规则差异等问题,这些问题都会影响决策数据质量。所以,数据使用者需要对决策数据进行审计。区块链作为去中心化的分布式数据库,可以实现支持审计的数据存储和处理。此外,基于区块链在不同利益主体之间构建去中心分布式数据库系统,数据通过全网快速广播至各个利益主体,也能够保证数据共享流通的真实性和及时性。
2、支持验证的分布式数据统计分析和机器学习
在医学研究、公共安全和商业合作等一些应用领域,需要在大规模分布式数据集上执行统计分析和机器学习任务,但考虑法律法规等因素的限制,需要在不泄露隐私数据前提下进行分布式数据统计分析和机器学习。
基于区块链实现可验证的分布式数据集统计分析常包括数据提供者、多个计算节点、多个验证节点和数据查询者。其中,数据提供者提供加密数据,多个结算节点执行密文计算,由区块链组成多个验证节点并对计算节点的计算进行验证。除此之外,分布式数据集统计分析需要考虑数据机密性、数据提供者和数据之间不可连接性、查询结果机密性和计算结果的鲁棒性等安全和隐私问题。为此通常采用洗牌和同态加密等技术进行保护。
基于区块链实现可验证的和公平的分布式机器学习,数据提供者将本地机器学习参数上传和存储至区块链,由区块链执行交叉验证,将分布式机器学习过程的每一步都记录在区块链。同时,还可以结合零知识证明和密码学承诺对恶意的参与方进行经济惩罚,通过经济激励促进公平。除此以外,分布式机器学习需要考虑数据提供者本地参数的安全性,因为本地参数也可能会泄露数据或者机器学习模型。为此通常采用差分隐私、秘密共享和同态加密等技术对其进行保护。
二、不利因素
(一)国内数据安全面临挑战
1、数据贩卖严重侵害个人隐私
目前,数据贩卖已成为大数据产业的灰色地带,个人信息倒卖黑市猖獗,对个人人身、财产、生命安全造成了极大危害。一是外部攻击者利用爬虫等技术窃取并倒卖个人数据;二是“内鬼”常成为非法数据交易链源头;三是平台之间实施暗箱操作,通过数据兜售进行数据商业变现。
2、数据跨境流动带来国家安全隐患
在大国博弈持续加剧的今天,数据作为国家重要的生产要素和战略资源,其日益频繁的跨境流动带来了潜在的国家安全隐患。一是流转到境外的情报数据更易被外国政府获取;二是我国战略动作易被预测,陷入政策被动;三是我国以数据为驱动的新兴技术领域竞争优势将被削弱。
3、高价值特殊敏感数据泄露风险加剧
近些年,除电子商务、社交等领域的用户数据发生大规模泄漏之外,政务、医疗及生物识别信息等高价值特殊敏感数据,逐渐成为了数据泄露的重灾区。一是政务数据具有极高的社会和经济价值,黑客将其作为攻击目标可获得更高的利益回报;二是健康医疗数据具有高度隐私性和稀缺性,成为攻击者的关注重点;三是生物识别数据具有易采集和特征敏感性,成为攻击者的主要目标。
4、重要数据安全面临外来攻击威胁加大
具有政治背景的境外黑客逐渐加大对我国关键信息基础设施攻击力度,试图获取我国机密重要数据。
5、新技术新应用催生新型数据安全风险
新技术新应用在极大促进生产力发展和人民生活便利同时,也带来了安全方面的不确定性。
6、互联网平台企业滥采滥用个人信息并实施数据垄断
当前,由于互联网平台企业的业务大都由数据驱动,商业推广、精准营销、产品迭代等均依赖对数据的海量收集和开发利用,数据成为了平台企业发展和盈利的核心引擎。基于数据收集使用创新商业营收模式,实现利益最大化,成为了各个平台企业追逐的商业目标,由此也引发了个人信息滥采滥用程度加重、数据垄断乱象频发的数据安全风险。
(二)数据治理面临三大现实挑战
数据作为数字时代基础性战略资源,是区别于以往工业时代、农业时代最重要的生产要素。国家在大数据产业发展方面出台了相关规划和工作部署,各部门各地方也做了大量有益探索并取得了显著成效。伴随产业发展,数据治理也被提上日程,由于数据具有虚拟属性等特性,治理面临三大挑战:
一是产权难界定。产权对于数据流通、交易、再利用等全生命周期至关重要,而数据作为无形生产要素既具有虚拟属性又涉及多主体,与传统有形生产要素有明显差别,其涉及的所有权、使用权等随场景变化而动态变化,加大了产权构建的难度。
二是边界难厘清。数据不同于传统的物品,只有流通起来才能产生价值。实践中数据需要通过流动汇聚发挥作用,其在发挥作用的过程中通常需要跨越行政部门的职能边界,难以完全沿用传统部门分业监管的职责划分来管理。
三是权益难平衡。数据治理至少要涉及国家、企业、个体等不同主体,涉及安全、产业发展和隐私保护、跨境流动等多方面诉求。在实际数据流通中,各种权益随场景变化并相互嵌套,往往你中有我、我中有你,处理不当可能造成顾此失彼。因此需明确战略优先,统筹平衡,兼顾眼前与长远。
(三)数据管理不完善
(四)企业数据治理缺乏有效抓手,数据治理工作很难推进
数据量的急剧膨胀通常会导致系统中的数据质量变差的问题,也因此会给数据存储、处理和分析各环节的性能和使用效率带来很大挑战。此时,企业需要通过开展数据治理工作来提高数据质量。然而,在企业的实践中,数据治理工作经常会半途而废,其中最核心的原因在于,数据治理工作往往非常繁杂和耗时,当企业缺乏有效的抓手去开展数据治理工作时,将很难产生直接的成果和效益,到了后期也就无法继续推进。
1.1.2 2024-2028年中国数据治理行业市场规模预测
2022年,我国数据治理行业市场规模为133亿元;2023年,我国数据治理行业市场规模约达到162亿元。
我们预计,2024年我国数据治理行业市场规模将达到198亿元,未来五年(2024-2028)年均复合增长率约为14.47%,2028年将达到340亿元。
图表 中投顾问对2024-2028年中国数据治理行业市场规模预测
数据来源:中投产业研究院