原创 数据的确权、流通、入表与监管研究(三):数据与入表

发布日期:2024-09-19 17:20

来源类型:公狒狒 | 作者:Medders

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【澳门精准王中王免费资料】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【2024新澳门天天开好彩大全】【2O24澳彩管家婆资料传真】
【494949澳门今晚开什么】 【2024新澳免费资料】 【香港4777777最快开码】

作者:张建军,中国电科首席专家,神州网信技术总监

本文约5000字,建议阅读10分钟

本文主要介绍数据的确权、流通以及入表的四项规则。



2022年12月发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出了需要“构建数据基础制度”,而数据确权、价值评估、流通监管是建立数据制度的三个基本问题。为分析这三个问题,需要建立一个理论模型和分析方法,并在此基础上,提出基本的确权规则、流通规则、入表规则和监管方法,目的是为前述三个问题的分析和解决提供一种在法律、经济和技术上逻辑清晰的架构和方法,推动相关问题的落地解决。



本文是系列文章的第三篇——数据与入表。


先说结论:具有明确排列规则和编码规则的数据才能资产化;数据价值存在于从原始数据到现实空间的价值链条中,不同种类的数据根据其在价值链条中的位置享有对应的价值,通过市场机制影响其交易价格;数据权属会影响数据入表,列入存货的数据资产必须要有“使用权交易”或“所有权交易”的授权,列入“无形资产”的数据必须要有“使用授权”。


基于上述结论,提出如下的入表操作规则:


入表规则一:具有明确数字排列规则和编码规则的数据集才能作为数据资产的对象,且为企业单独拥有、共有、企业无所有权但有使用权的数据集才能作为企业的数据资产。

入表规则二:根据数据所有权者的权益和授权,所有可用于使用权交易或所有权交易的数据可列为“存货”,所有企业自用的数据为“无形资产”。

入表规则三:“存货”类数据的交易价值按照使用权交易、所有权交易(或用益物权)交易两种类型分别计算,具体交易价值应根据数据分类分别确定价格;使用权交易可以进行多次,所有权交易只能进行一次。

入表规则四:共有的数据、被设置了用益物权的数据,应根据相关法律、合同约定,计算(估算)成本。


一、 数据资产化的技术前提

如《数据与确权》一文所述,数据是信息系统中(赛博空间)按照一定排列规则(即:数据结构)排列的、符合一定编码规则(即:有含义)的数字集合。


尽管存在一些数据交换的标准,但绝大多数信息系统都有各自不同的数字排列规则和编码规则,其原因是多方面的,系统架构、功能实现逻辑等等很多方面都会影响实际的数字排列规则和编码规则。数据使用的技术基础就是清晰定义的数字排列规则和编码规则(在计算机编程中分别对应的是数据结构和信息编码规则)。在一个信息系统中,实现这一点相对容易,但在不同的信息系统之间(甚至同一系统的不同版本之间),要实现统一的数字排列规则和编码规则并不容易。原因就在于这些规则绝大多数情况下,都不是单独定义和存在的,而是存在于数据处理程序的逻辑之中。这也是导致很多信息系统无法实现数据交换和互联互通的主要技术原因之一。


数据资产化的目的是数据的使用和反复使用,支持跨不同所有者信息系统的数据流动(即:数据流通、数据交易)使用。对特定的一组数据集,能否资产化的技术前提就是该组数据是否存在明确规定的数字排列规则和编码规则,或者存在相应的程序工具能够将数据集中的数字解析成可再被处理的数据。没有准确定义排列规则和编码规则的数据,是无法再使用的。因此,企业中特定数据集能否资产化,其技术前提就是该数据集的排列规则和编码规则是否清晰和准确。


二、 数据的流通和交易价值


数据资产化的目的应是更好地促进数据要素的流通和交易,便于数据反复使用,以产生更多的经济和社会效益。但数据跟一般物化的生产要素不同,数据本身并不会直接对现实空间产生影响,必须通过“现实化”环节才能影响现实空间,也就是说:能够现实化的数据才会产生直接的经济和社会效益。能够现实化的数据则需要对模型类数据、原始数据和次原始数据的处理才会产生,这样就构成了数据价值的传递链条,如下图所示:



预测/统计类数据、研判/决策类数据、自动执行类数据是可以直接现实化的数据,一旦现实化就可以直接产生经济或社会效益,这些数据的价值是最明确,且可以直接衡量。效益可以是正面的,也可能是负面的,只有正面经济和社会效益的可现实化数据才具有资产化的价值。在不同的行业、应用场景中,这类数据流通和交易的情况差异很大。也就是说,在一些行业和应用场景中,这些数据的产生和现实化环节只会发生在一个企业中,因此就不存在这些数据流通和交易的情况;在另外一些场景中,这些数据则可能在不同企业间流通和交易。


模型类数据往往承载了所发现的实体空间的事实或变化规律与规则,这些“发现”的准确性、适用范围(或使用限制)基本决定了模型的使用价值。近年来信息化的热点,如:数字化转型、元宇宙、人工智能、大数据分析等的核心成果就是各类模型数据。不同模型类数据的产生过程(即:建模过程)是一个相对复杂、成本差异可能很大的过程。一般情况下,模型类数据的产生除了需要好的建模方法外,还需要一定规模的高质量次原始和原始数据。因为模型类数据承载了发现事实或规律的规则,有着相对比较广泛的用途,故模型类数据是数据交易中的重要对象,也是附加值比较大的交易对象。


原始数据和次原始数据直接反映了实体空间对象(人、机构、物)的状态、属性、关联关系,这些数据按照时间组织起来,就会形成相关的历史变迁记录,按照空间组织起来,就会形成运动轨迹。原始数据和次原始数据是所有数据中应用场景最广的数据,但也是最难直接产生现实经济和社会效益的数据。一方面,原始数据和次原始数据会直接用于各类分析,以生成模型数据;另一方面,可现实化的数据也是对现实空间当前状态和历史状态,用各类模型和规则综合处理所产生的。显然,对一组原始数据或次原始数据,反复被处理的场景越多、产生的衍生数据越多,其价值越大。同时对现实空间反映越全面、越准确(精度越高)、越及时的原始数据和次原始数据(即:质量越高的原始和此原始数据),对后续处理的价值也越大,价值越高。多年的信息化实践,在不同领域已经形成了原始数据和次原始数据质量的标准,这些标准可以是评价原始数据和次元数据价值时非常好的参考。原始数据是数值化活动产生的,次原始数据则是对原始数据进一步的整理、比对、清洗等加工后形成的。对一定规模的原始和次原始数据而言,其数值化和产生成本是很大的。信息化的发展,让原始和次原始数据沉积在了不同主体、不同的信息系统中。对高质量、大规模原始和次原始数据的需求,自然就会产生这些数据流通和交易行为,以节省成本,这导致原始和次原始数据会成为数据交易中需求最迫切、交易规模最大的对象。


上述讨论了数据的价值问题,但数据价值和数据交易的定价是两个既有关联但又不同的问题。数据定价应同时考虑数据产生的成本和附加值。数据附加值要按照分类,根据数据在价值链中的定位和其自身特点,通过市场化的机制确定其附加值。


三、 企业数据资产的确权及其对入表的影响


企业数据资产涉及的相关方主要有三方:企业本身、企业员工、外部主体。企业数据同样分为:原始数据、次原始数据、模型数据、预测/统计数据、研判/决策数据、可自动化执行数据几类。这些数据的产生有三个来源:企业实施的数值化活动、企业实施的数据处理活动、从外部直接输入的数据。


企业在日常的经营活动中,会跟各个相关方产生交互活动:企业的业务活动主要涉及客户(外部主体的一类)、业务合作伙伴;企业的管理、经营活动则会跟企业员工、政府机构、其他机构等进行交互。企业在这些活动中,企业信息系统会因为企业业务和管理运转的原因而留存大量的原始数据,根据确权规则(见“数据与确权“一文),这些数据中会有大量的所有权属于现实主体——企业员工和外部主体的数据,同时还有大量共有的原始数据。这些数据如果要列为企业资产,必须基于企业合法使用的授权列入“无形资产”或“存货”。


企业的数据处理活动主要有三种,分别对应次原始数据的生成、模型类数据的生成、可现实化数据的生成(包括:预测/统计数据、研判/决策数据、可自动化执行数据)。这些数据的权属可按照“数据与确权”一文中的描述,确定结果数据的权属。对于共有的原始数据来说,可以在生成次原始数据的过程中尽可能完成数据的“去关联”处理,将共有数据转化为企业独有数据。对其他类型的数据,如果输入数据中有共有数据,企业应尽量避免在结果数据中出现共有的输入数据(或共有输入数据的子集),并与输入数据共有方协商好结果数据的所有权,尽量避免结果数据共有的情况。


所有权清晰的数据才可以入表,其中列入存货的数据是必须具备“使用权交易”和“所有权交易”的授权。对于非企业独有的存货类数据,企业必须具有相关所有者对“再次使用交易”的授权;对列入“无形资产”的数据,企业必须要有合法使用权。


四、 数据入表操作规则


本节基于2023年发布的《企业数据资源相关会计处理暂行规定》(以下简称“会计处理暂行规定”),按照所提出的确权规则、交易规则,提出如下的数据资产入表规则:

入表规则一:具有明确数字排列规则和编码规则的数据集才能作为数据资产的对象,且为企业单独拥有、共有、无所有权但有使用权的数据集才能作为企业的数据资产。

企业不是所有的数据都能作为数据资产的。


如本文第一节所述,列入资产的数据必须具有清晰准确的数字排列规则和编码规则,缺乏这些规则(或拥有错误规则)的数据集是无法再使用的,也就失去了资产化的意义。判断一个数据集是否拥有相应的规则,可以根据数据的内容、生成方式、来源等进行判断,也可以通过一定的技术手段进行核实。


对数据是否拥有合法的所有权或使用权,是数据成为资产对象的另一个重要条件,这也是数据能够给企业带来经济效益的前提。如“数据与确权”一文所述,数据的权属实际有:独有、共有、无所有权但有使用权、无所有权但有用益物权等情况。对原始数据、次原始数据、模型类数据、预测/统计类数据、研判/决策类、自动执行类数据,各类数据各有着对应的权属划分规则。企业应对入表的数据,按照分类确定权属关系后,列入资产。


入表规则二:根据数据所有权者的权益和授权,所有可用于使用权交易或所有权交易的数据可列为“存货”,所有企业自用的数据为“无形资产”。


数据的交易和使用有其自身特点,需要根据数据所有者对数据的使用授权进行。


依据《数据与流通》一文描述的规则,对于来自外部、通过流通和交易获得的数据,默认规则下企业是只有使用权利的,且不能再次流通或交易,这类数据只能做为无法交易的“无形资产”处理。


作为存货的数据资产只能是已经确权为企业拥有的数据,或者企业持有的非自己拥有的数据,但有对这些数据进行“使用权交易”的授权。


规则三:“存货”类数据的交易价值按照使用权次数交易、所有权交易(或用益物权)交易两种类型分别计算,具体交易价值应根据数据分类分别确定价格;使用权交易可以进行多次,所有权交易只能进行一次。


这是根据“数据与流通”一文中描述的交易规则而确定的。


一个数据集的使用权交易可以多次进行,每次交易的价格可以不同,根据市场需求来确定。数据的特点决定了每次使用权交易对数据本身不会有任何损害,因此只要有使用需求,数据是可以一直进行使用权交易的。使用权交易的基本计量单位为次数。


对企业拥有所有权的数据,除“数据与流通”一文中规定的不可改变权属的数据外,是可以进行所有权交易的。根据交易规则,所有权交易只可进行一次。


数据交易的价格要考虑两个因素,即:数据的获取成本和数据的附加值。其中数据附加值要充分考虑本文第二节中描述的数据价值因素。一般来说,可现实化数据的附加值相对容易评估,可以依据其对实体空间的影响情况,及其潜在的经济回报确定;模型类数据的附加值跟其应用领域和准确度的关系非常大,一些领域类存在评估模型准确的客观标准和方法,这些标准和方法对于确定模型类数据附加值有很好的参考价值;次原始数据和原始数据的附加值相对比较复杂,其覆盖范围、规模、精度、准确度、时空跨度、及时性等都会对其使用价值产生影响,在一些特定的领域存在一些数据质量的标准可用于对模型类数据附加值评估的参考。


目前从理论和实践上并不存在一种客观、普适的数据附加值评价方法,更多依赖市场需求关系确定附加值。


数据的获取成本比较容易确定,主要是数字化、处理(见《数据与确权》一文描述)等环节的直接和间接设备、物理资产、人力等投入,有时还需要考虑数据存储和保存的成本。


规则四:共有的数据、被设置了用益物权的数据,应根据相关法律、合同约定,计算(估算)成本。


共有数据、被设置了用益物权的数据意味着数据的其他拥有人已经(或者可能在将来)提出权益主张,这些权益主张也是数据使用的成本,在资产入表时也须予以考虑。这些权益主张的兑现既可能发生在企业持有这些数据之前,也可能发生在数据被企业交易之后,这都会对数据资产的入表产生影响。共有数据的权益主张会随着数据的存在而一直存在,企业应在入表时正确处理。

MacCormack:

4秒前:上述讨论了数据的价值问题,但数据价值和数据交易的定价是两个既有关联但又不同的问题。

董志华:

9秒前:数据定价应同时考虑数据产生的成本和附加值。

黄伟良:

5秒前:共有数据、被设置了用益物权的数据意味着数据的其他拥有人已经(或者可能在将来)提出权益主张,这些权益主张也是数据使用的成本,在资产入表时也须予以考虑。

Linseth:

5秒前:对原始数据、次原始数据、模型类数据、预测/统计类数据、研判/决策类、自动执行类数据,各类数据各有着对应的权属划分规则。