下载客户端

专业者言｜数据确权：确定产权还是确定规则？

黄少卿上海交通大学安泰经济与管理学院教授

2023-07-12 15:24

听全文

一

经济学关于产权一直有两种观点：一是“产权产生交易”，主张明晰的产权会带来交易的便利化并促进交易发生，由此进一步促进商品或要素的流动，因之，产权确定非常重要；另一种观点主张“交易产生产权”，强调的是交易结构已包含确权的规则，既然交易规则里有确权规则，那么，交易过程同时就是确权过程，因为交易要运用到确权规则。后一个观点似乎有点不好理解，且通常容易被忽视。

数据作为生产要素，明晰产权很重要。因为这有利于数据的交易和流动。但是，更加重要的是，如何界定数据产权。当前，数据产权立法的工作非常必要，核心问题在于要明确立法的基本取向。我认为，与其试图给数据事先确定一个绝对产权，更合适的做法应该是设置确定产权的游戏规则和程序架构。从这个视角出发，很多问题就能有一个包容性答案，不同观点不会显得相互矛盾。有人所感到的困惑也可以化解，即如何协调确定权益和促进数据流动两大目标，二者可以不是对立关系。

数据流动是否产生价值？从经济学角度讲，价值的产生和创造通常是企业家的工作，只要确保数据流向企业家，由他们来处理和使用，就会产生价值。问题在于，如何确保数据向企业家流动？非常重要的一个条件，就是要有竞争性交易。只要有竞争性交易，越具有企业家才能的人，就可以报出越高的价格，自然有利于数据通过交易向企业家流动。但交易不就要确权吗？不是只有事先确定产权的数据才能产生交易嘛？这正是前述第一种观点的看法。

在海量数据时代，如果政府要对每一个数据的产权在交易前进行确权，不但确权成本巨大，甚至会出现难以确权的情形；另外，大量确权后的数据可能无人问津，而使事先确权的工作失去意义。正如有专家所言，数据不会在使用中被损耗，只会在不被使用中不断失去价值。既然一直没有得到利用的数据不会自己产生价值，因为数据要在使用中产生价值，那么，更恰当的应该是在使用中确权。不被利用的数据没有价值，也就没有交易前确权的必要。

设想一种情形：有人要购买你掌握的数据。为什么？一定是你的数据有其独特价值，从其他人手里买不到。为什么你的数据比别人的数据蕴含更大的独特价值？一定是因为数据已由你做过创造性加工，赋予其独特的价值属性。因此，如果遵循无瑕疵原则，只要加工之前是通过合法交易取得的数据，即数据获得的前位程序没有瑕疵，那么，经你加工处理后的数据就可以合法继续交易。而新的交易实质就产生了产权——让数据处理工作所创造的价值确权给创造者本人，即，交易过程对你的加工工作所创造的额外价值权属给予认定，从法律上把这部分增加价值的产权界定给你了。

中国古代的房屋交易，很多时候并不要求卖的房子要有产权证书。事实上，中国古代政府通常不提供产权登记证明。但是，只要有一个东西——契书，就是和上家做交易的契书——盖了政府的章，由此证明获得土地和房子的前位程序无瑕疵，只要有购买房屋契书，后面就可以卖。

数据也一样。不过，前置无瑕疵规则的运用可能比土地房屋更复杂，不是简单一份契书就可以解决。这就涉及确权规则问题，包括用益物权问题。用益物权的确有排他性，如果完全没有排他性就没有收益权，不排他就没有办法说这个东西一定是我的，也无法用来产生收益。关键在于，这是事先的排他还是事后的排他？

事先排他意味着事先要确定产权；只在交易过程中确定排他属性也没有问题。事后确定本质上还是要有确权规则。有了确权规则就能够促进交易，促进交易就有收益发生，有收益发生，就会促进各种对数据的价值创造性加工和深度开发。有了数据加工和深度开发，自然带来了对整体经济的更大价值。

那么，确权最终是什么问题？怎么确权？这是一个认知问题，说得玄乎点，是脑科学问题，是如何对世界本质进行认知的思维方式问题。《决策的大脑》一书说，我们对世界的认知框架是与生俱来的。非常小的孩子就有财产权观念，这种财产权观念是一些预设的思维方式，比方说，认为付出了劳动的对象就应该拥有产权，而不仅是因为谁占有这个对象。书中特别讲到卢梭在《爱弥儿》这本教育学名著里的一个例子。

基于罗马法及后来发展出的民法，是强调基于占有来确定产权。这个规则很简单，简单且有效。在农业时代、工业时代，确定产权的规则一直就这么用下来了。

事实上，除了这样一个认知框架和确定规则的框架之外，现实世界还有一种规则，和《决策的大脑》给出的认知框架类似，是洛克在《政府论》里强调的，只有劳动才能产生产权。马克思的劳动价值论即源于此，这是另一个重要的确权渊源。因为，根本意义上，人生下来唯一拥有产权的就是自己的身体，所以，后续衍生的产权都基于身体而来，即基于身体的劳动而来。

基于身体劳动的产权是自己身体产权的衍生品。终极意义上，每个人只能占有自己的身体，占有不了别的东西——那是上帝创造的。基于这个占有的意义，那么，源自个人的原始数据的产权就像个人身体一样，天然由个人所拥有。以此为基础，才能谈衍生的产权和权利。如果我们同意劳动产生产权，这就意味着，如何确定数据产权要有更基准的游戏规则，即占有数据者是否在这些数据上付出了额外劳动。在数据不断流通或使用过程中，不管公司或个人，如果对其进行加工、开发，赋予劳动，那么这些环节所创造的价值，其产权就要界定给付出劳动者。

在我看来，基于劳动投入而占有相应权利，这种确权程序安排，将有利于数据的开发与加工。用这个规则取代过去纯粹意义上的占有规则，可能更有助于实现合理的数据产权确定。

总之，人类有两类确权规则，这两类规则是纯粹意义上的。到今天为止，不同国家不同民族现实运用的财产权利规则，都混合了这两个规则的因素。只不过有时这个规则因素多一点，有时另一个规则因素多一点，并不一定是纯粹意义的某一种类型的产权规则在绝对性地起作用。

二

由此，如其他学者所说，数据产权的产生过程分两个步骤。首先是从个人到平台，即从主体1到主体2，其次是主体2到主体N。我同意这个两阶段分类。当然，我更愿意把它看成是两类重要关系，第一类从个人开始，个人包括自然人、也包括法人——法人也有它的人格。也就是说，这个人格权不仅是自然人意义上的隐私权，名誉权等其他人格权也要考虑到。从个人到平台公司，或者到所谓主体2，即着手数据收集加工的主体，这是第一阶段的关系。第二阶段是从主体2到主体N，即数据收集加工以后在不同主体之间的流转关系。

这两类关系差别很大。第一阶段数据从个人——不管自然人还是法人——那里，通过收集整理后流转到作为平台的主体那里，这是数据形成价值的关键一步。原因在于，数据的经济价值可帮助掌握它的经济主体更好地理解市场结构，从而做出正确的经营决策。即，数据的价值来自海量个人信息汇总后得到的对市场整体结构的认知，而个人信息数据本身无法产生这一价值。所以，有效的数据产权规则应最大程度降低个人信息汇总为整体信息这一阶段的交易成本。

如果个人基于数据权利不同意有关自己的数据被收集，完成这个过程就会发生巨大的交易成本。但如果法律上不明确个人对自己的数据权利，导致平台对个人数据随意收集和使用，又必然带来隐私权或人格权的侵犯现象。因此，个人天然拥有与自身相关数据的权利这个基点并不能动摇。

那前述问题如何解决？为降低交易成本，第一阶段数据的收集汇总应遵循两个原则。第一个原则叫依默许而取得。针对个人数据的收集整理，只要个体不反对就应被视为同意。默许就是“可以”。“可以”的说法比较抽象，但默许在行动上是具体的，即没有反对的表态。譬如，个人登录某个网络平台，可能涉及被收集个人数据，只要个人点击进入后愿意注册并使用这个APP（当然，个人如果觉得不愿默许，也可以放弃）——这个行为就被理解为默许。

第二个原则是什么？数据收集过程中，“默许+收集”本身要生成新的法律关系，即信托法律关系。当个人默许后，并不表示平台拿到个体数据就没有责任了，因为这些数据转移到平台手上，数据收集不仅会产生财产属性，而且，它们内涵着另一个属性，即前面讲到的附加属性，就是很多隐私信息也在里面。财产属性和隐私属性两者不可剥离。有人认为通过脱敏可以剥离，但脱敏处理还是难以剥离干净，真要把所有敏感信息剥离掉，可能这个数据的价值就不大了。如果不知个人在哪里生活、每天买什么东西，也就失去了数据的财产属性和经济含义。如果知道这些信息，仅仅把名字隐掉，要把具体个人找出来可能也并非难事。总之，脱敏处理很难实现100%的隐私剥离。

个人数据被平台公司等主体所收集时，相当于其隐私也被获取了。由此，数据收集马上会产生不对称关系，导致平台对个体的信义义务，即，数据收集者负有保护对被收集数据个人的隐私权的义务，这个责任从收集数据的瞬间就确立起来了。而且，未来通过交易而获得这些数据的其他主体，将同样负有该义务。

也许人们会问，法律上当然可以如此界定，问题在于，怎么确定这一义务是否得到履行？我的建议是，一旦信义义务被确定下来，被收集数据的个人如果产生隐私已被侵犯的疑虑，就可提出起诉，起诉后，举证责任落在收集数据一方。因为信息严重不对称，个人不了解平台算法，不知平台在如何使用数据。因此，个人在保障自己数据不被滥用上缺乏必要的手段和信息，除非平台举证自己无过失。如果是个人，反驳不了这一举证就应该接受；如果平台无法举证，就要冒被认定为违背信义义务、侵犯个人隐私的法律风险，违背信义义务将受到法律制裁。

总之，第一环节的数据转移为从个人——不管自然人还是法人——到收集数据的平台，必须建立这两个原则：默许原则和基于“默许+收集”所产生的信义原则。否则，第一个数据转移的环节将因巨大交易成本而难以完成。倘若这两个原则得以确立，扯皮情况将大大减少，由此可以进入第二阶段，即拿到个人数据的主体，如平台公司，可以通过数据加工或开发等数据增值工作，进而进行数据交易，让增值后的数据进一步流动起来。

这个阶段的数据处理和使用有两种方式：要么出售给其他主体作为中间投入品再加工，即到主体N那里去；要么直接出售给终端用户。不管以什么方式获取收益，都要把数据服务和产品进行出售，一定会有出售过程。

那么，在出售过程里，怎么确定数据产权？这时，像前面的分析那样，需要建立基于劳动的产权确认规则。经济生活中存在很多无形资产，像知识产权，它的确立正是基于劳动。权利人首先要有一个想法产生，再把它变成可申请专利的具体知识，包括把著作写出来。写成著作的那些文字类似原始数据。通过不同文字的组合写出一本新书，看上去是在我们学到的五千个汉字中反复重组，但形成了新知识和新著作。音乐也是这样，几个音符，哆来咪发唆拉西是既有的，通过音乐创作者重新组合，形成了拥有版权的新作品。数据的加工开发处理也是如此，加工主体在原始数据基础上所做的新开发，也会带来新的数据权利。

这个过程中，因为上面附加了劳动，才能给数据加工处理的主体以确定的数据产权，正如给作家或作曲家以确定的书的著作权或音乐作品著作权一样。数据产权同样如此，因为确权原则没有发生变化。拿到原始数据的主体对这些数据加工处理，让它以一种新的形式体现出来，而加工处理给后续使用者创造了价值，导致后来者愿意购买。自然而然，基于劳动就能把数据处理工作创造的价值的产权确定起来。

当然，基于所谓劳动产生财产权的原则和基于占有产生财产权的原则，在数据产权的确定上可以结合。用益物权，就是针对已存在物品进行加工等增值努力，再使用它并获得收益。这种用益物权跟基于劳动获得财产权利不必然存在矛盾。

三

第三个问题，数据流通过程中，怎么知道交易主体的数据从上游取得的过程符合无瑕疵原则。即如前面所说，交易时需要确保没有人对所交易数据的产权进行质疑或索取，说出售数据的主体不具有产权，而指控是从自己这里通过爬虫手段等非授权方式得到的。当然，法律上如何界定爬虫行为的性质，是否应认为其合法？目前可能存在争议。在我看来，即便是公开信息，哪怕是前台信息，且不论后台信息，这些信息经过加工后把它公布出来，也不表示他人可以直接复制使用。相当于我的音乐作品，既然让大家都唱了，并不表明有人可以截取其中一段，在不付费的前提下放到自己的作品里，显然这是属于侵犯版权的行为。因为，基于付出劳动就要获得产权这样的游戏规则，和付出劳动以后的数据存在形式是公开还是隐蔽的无关。所以，对爬虫行为，将来法律上要有所界定，不同意恐怕就不能爬。换句话讲，要爬虫可能也要基于交易或许可，就是上一端数据获取方的许可，才能让爬虫者得到合法权属。

怎么确保手上的数据在前端已得到许可，符合无瑕疵原则？这是一个很难的问题。因为数据不断流动，A手上有的可能B手上也有，C手上也有。如果A要去索取权利，就会说从B那里得到，如果B要去索取就会说从C那里得到的。

这个问题怎么解决？我主张，借助当今日臻成熟的区块链技术。区块链技术可以帮助清晰界定各种数据的流动轨迹——数据从哪里得到的，得到过程是不是已获得前置许可，或有什么法律凭证确保不是非法取得。哪怕是爬虫，不得到许可也是非法取得。

如果前置程序没有获得许可，后面即便做了数据加工，创造了价值，也要把前置程序补全，通过赔偿等方式补上前置许可，才能进行后续数据交易获益，否则，这个交易就是有程序瑕疵的交易。区块链技术帮助我们准确把握数据流动的轨迹和痕迹，这个问题就不难解决。我相信，区块链技术在数据市场要素确权和交易过程中必将发挥重大作用。如果这个作用不发挥出来，那么，数据确权和数据交易流通，乃至数据市场的形成，以及，最终帮助我们实现数据收益的分配——分配也是交易过程，交易过程实现了收益也就实现了分配——恐怕这些都难以实现。区块链技术未来怎么进一步完善开发，国内也要有相应立法跟上，我认为这是重要的配套制度。

最后说一下政府相关立法。我一直主张，政府不要行天道，而要行人道。不要老想替天行道，认为自己手上掌握绝对真理——掌握绝对的确定性。今天讲立法一直在强调确权，似乎政府认为自己可以确定性地给出一个合理的产权安排。恐怕这个立法思维要调整。数据确权立法中的“行人道”是什么？是不需要确定权利，但要确定确权的规则，在这个规则下，让每个市场主体去博弈——人们基于利益和成本考虑、对伦理和法律的尊重，当然还包括对效率的追求、对公平的考虑，这些都会在博弈过程中体现，从而最终形成博弈的均衡。这个均衡是“人道”的体现。如果政府的数据确权立法，不是要确定一个确定性的权利——像过去罗马法、民法的传统那样，而是建立有利于数据产生、开发利用，并且可以创造收益、创造价值的游戏规则，这比什么都来得更重要。

（本文是作者2021年7月10日在上海社会科学院“面向数据要素市场的企业数据权益配置研究”专家研讨会上发言速记稿的修订稿，修订稿完成于2023年6月28日）

责任编辑：王昀

校对：栾梦

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报

#专业者言 #经济学 #数据确权 #产权 #规则 #劳动价值