“ 对于原始、公开信息,要充分保障整个社会对该类信息资源的合理利用,以维护信息公平和促进更大范围的创新。。”
2022年12月,党中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(以下称《数据二十条》),从数字产权、流通交易、数据分配和数据治理四个维度系统地布局了我国数据基础制度体系的“四梁八柱”,具有里程碑式的重要意义。
同时,大家也意识到,任何一个市场要取得发展,第一步必然是对进入市场的要素进行确权,数据要素市场也不例外。对于数据如何确权,学界和商界都有开展了广泛的讨论。
在本篇之前,鼹鼠哥也有其他几篇相关文章提及数据资产化中数据确权的作用,有兴趣可以参考。
[数据概念]7W1H-什么是数据要素、数据资源、数据资产、数字资产,数据管理、数据治理、数据入表?如何实现数据资产化?(qq.com)
数据产品确权估值案例解析 (qq.com)
[方案实操]如何破解数据交易、估值和入表的难题 (qq.com)
另外,在 最全全国十七个数据入表和资产化案例深度解析 (qq.com) 中也可以看到,其中以公共服务数据入表的有4例,包括有通用的公共数据,或者城市运营如水务或企业信息等数据。排名第二的是交通类数据,包括高速交通,城市停车数据等。这两类都可以归为泛公共数据。从中也可以看出公共服务数据在当前阶段是更容易确权,且价值更容易得到认可的数据。
那么,问题来了
原始/公共数据应该被赋权吗?
应该被赋权给什么样的主体?
如果可以,哪些原始/公共数据可以被赋权?
赋权过程和企业数据赋权又有什么差异呢?
UGC的数据到底算原始/公共数据还是企业数据呢?
我们将就这些问题把业内的讨论内容跟大家做一个分享,最后还会结合一个已经落地判决的案例跟大家做一下解析。
让我们开始吧。
01—数据该被赋权吗?
数据与和知识产权等智力成果最为接近,从法学角度讲都是无体物。
长期以来为人类社会所公认的财产,一般都是具有实体的有体物,例如房屋,金条等,他们天然能够被排他占有,通过转移占有进行交易。
无体物与有体物不同,具有非排他性和无消费竞争性。非排他性是指,一个人对这些无体物的使用,如对作品、技术方案或是数据的使用,在没有法律禁止的情况下,客观上无法排除他人对这些无体物的使用;无消费竞争性是指,一个人对无体物的使用,并不会影响或减损他人对无体物的使用,多个主体均能从中获益,甚至完全可以同时从中获益。
对无体物赋权,使特定主体排他占有无体物,并不完全与天然的道德和正义感吻合,和有形资产长期以来一直被赋予财产权不同,一般认为,对智力成果赋权的知识产权法律规则起源于18世纪,是时代性的产物。
新兴的数据类无体物,是互联网时代的产物,与智力成果具有相似的性质,知识产权赋权的理论路径可以为数据权益保护提供经验和参考。
数据就其自身非物质性而言,难以被排他性占有,对数据赋以财产性权利实际上是人为划制行为边界,将原本属于公有领域的数据圈入私权的范畴。正如知识产权保护是通过赋予权利人排他性的权利来鼓励创新,实现社会总福祉的增加,数据赋权的正当性也必然以是否促进社会整体利益作为考量。 “产权制度安排是必要的,它是‘决定长期经济绩效的基本因素’。”但对数据赋权是否真的能达到促进数据产业发展、促进社会整体利益的目的,学界和商界尚无定论。
然而,对数据设置专有性权利可能对市场和经济发展带来负面的影响这一观点却有据可查。2016年8月,德国马克斯普朗克创新与竞争研究所在其发布的针对数据所有权与数据访问问题的立场声明(Data Ownership and Access to Data)中指出,承认数据的专有权没有经济上的合理性,相反,这将带来干扰经营自由和竞争自由的风险,以及阻碍其他依赖数据的市场参与者进行经营活动的风险,并对下游数据市场的发展产生负面影响。
如今,即使没有设置专有性权利,数据也已经成为交易的对象,数据市场已然在蓬勃发展。《2023年中国数据交易市场研究分析报告》测算,2021—2022年中国数据交易行业市场规模由617.6亿元增长至876.8亿元。
未来,中国数据交易行业仍具有巨大的市场增长潜力。实际上,对于公司认为值得保护的数据,它们会采取技术手段确保不被第三方获取。在数据的交易和利用过程中,可以约定在未经授权的情况下对数据的泄露附加违约金条款,依赖传统民商法对合同双方行为进行规范。如此一来,即使没有专有权利,数据市场也能良好地运转。引入新的制度是推动市场的良性运作,还是扰乱既有的市场秩序,仍有待进一步探讨。
02—什么样的数据能被赋权?
有专家指出,数据赋权的数据应具备两个技术特征:衍生性和集合性。衍生性是指受保护的数据限于经过加工、处理后可为市场主体利用的衍生数据,而自动生成的、非结构化的原始数据不在保护范围之内。集合性是指受保护的数据是大规模数据而非静态单向的小数据。
但是,仅依赖这两个特征进行操作也存在一些问题:
首先,具备这两个技术特征的数据实际上就是现在数据产业中所言的“数据产品”,是经过处理、编排、设计后,适用于具体应用场景的数据集,本来就能作为“具有独创性的数据库”受到现行著作权法的保护。另外设置专门制度保护的意义何在?比如一些公开的慢性病数据,这些数据产品是基于海量的用户基本数据及业务数据,面向各行业客户提供的标准化产品,通过输入性别、年龄段,可以查询该人群的慢病史情况,包括慢性病名称及对应患病人数。该数据产品对于原始的用户数据进行了具有独创性的选择和编排,本身就应当认定为“具有独创性的数据库”受到著作权法的保护。
鉴于我国并没有明确的法律法规或司法解释界定数据库选择与编排方式的“独创性”,因此在司法裁判中对数据产品的独创性判断的确可能存在较大差异。但退一步讲,即使某种数据产品确实无法满足现行著作权法对作品的独创性要求,而又有必要对其进行保护,也完全可以通过发布司法解释等方式明确将“数据产品”这一类别划入著作权法的保护范围中。相较于建立一个全新的数据保护体系,这种方式无疑更加简便经济。
其次,原始数据被明确排除在保护范围之外,但在近年来涉及数据权益的案例中,涉及原始数据纠纷的案件不在少数。收集原始数据需要大量投资,数据主体同样具有产权诉求,只保护衍生数据不包含原始数据,是否能充分实现立法目的,值得怀疑。
在大数据时代,数据规模进一步增大,收集原始数据成本也越来越高,大众点评网、百度搜索引擎、新浪微博等网络服务商常常耗费高额成本收集海量用户或第三方产生的数据,生成庞大的数据集合以提升用户利用其网络服务的体验。
在当前司法实践中,依照反不正当竞争法保护的数据集,更多是原始数据。既然数据赋权是为了推动数据资源的开发利用,促进数字产业的发展,那就应当充分考察市场的实际需求。
如果立法方案付诸实施,却将原始数据排除在保护客体之外,是否能达到产权激励的目的,实现充分激活市场活力的愿景呢?
03—公共数据应该如何和企业数据区分赋权?
目前已有的赋权方式多适配于企业数据,即市场主体在生产经营活动中采集加工而成的数据,而对于个人数据、公共数据并不适用。
我国法律对于个人数据不纳入数据赋权范畴有明确解释,“在中国业已完成《个人信息保护法》《数据安全法》制定的情况下,有关个人原始数据(信息)与企业数据产品的权益关系已有相关规范调整。”且不论个人数据是否确实应该被排除在数据赋权范围之外,但至少对于公共数据,目前缺乏相应的制度设计。
数据分类确权既是政策要求,也是实践的通用做法。在《数据二十条》中明确提到,要“建立公共数据、企业数据、个人数据的分类分级确权授权制度”;当前上海、深圳等地方性立法也已开始区分公共数据与企业数据,例如,《上海数据条例》(2022年1月1日起施行)规定了“公共数据”和“数据要素市场”,后者涉及市场主体拥有和交易的数据。
公共数据和企业数据在法律属性上存在差异,分类确权是数据赋权的内在要求。企业数据强调的是“强财产弱人格属性”;公共数据表现为“社会属性”。商业数据是无体财产,本质上是一种信息性资产,即具有商业价值并体现为数据的信息。而公共数据与政府公共职能服务密切相关,具有强烈的社会公益属性。
此外,两类数据的区分标准也是明确的,收集主体、收集对象和收集目的的不同,使得两者之间的界限可以清晰划分,因此应当构建不同的法律规则,不需要在产权界定上将它们混为一谈,而应分别单独界定。
总结来说,如果赋权的客体包括各种数据类型,那么应当对不同的数据类型进行分类确权;如果赋权的客体仅指企业数据,那么有必要在客体适格性上进行说明,以免造成不严谨的情况。
04—UGC数据如何赋权
常见的原始公开内容集合的“大数据”案件中,主张“大数据”权益的主体通常是互联网平台,如UGC平台(User-Generated Content,用户生成内容)微信、小红书等,平台中存在大量用户创作和发布的原始且公开的内容,UGC平台经营者主张其对用户发表的内容合集享有数据权益。
有些观点认为应当对这些原始公开内容集合赋予数据权益保护,他们认为互联网平台经营者在平台的建立以及内容的收集、存储、传输等方面投入了经营成本,而且内容合集能够为平台经营者带来流量等竞争利益,因此平台经营者对内容合集享有权益。
这种赋权逻辑与“劳动财产权说”一致,收集、存储、传输用户发布内容的劳动与整理电话号码簿的劳动相似。
但我们参考相对完善的知识产权保护体系。知识产权赋权正当性理论中,“劳动财产权说”曾经盛行,但经过分析和沉淀,这种理论存在无法自洽的缺陷,对知识产权赋权正当性的“劳动财产权说”已经遭到批判和否定。主流的知识产权教课书中都会提及,“电话号码簿案”经典案例对“额头流汗”标准进行了废弃。
更重要的是,客体的无体性使得权利边界不明晰,采用“劳动财产权说”极易导致以劳动之名不当侵占公共资源和他人权利,陷入“将一罐番茄汁倒入大海,即拥有整个大海”的悖论。
在对UGC平台内容合集赋权的场景中,这一悖论体现得尤为明显。用户作为原始内容的创作者,对内容享有法律明确规定的著作权,且著作权作为对世绝对权,不应在行权时受到不合理的限制。但对原始内容合集赋予数据权益后,用户创作的内容上就有了双重权益,用户行使自己的著作权时,特别是用户对其在平台上发布的所有内容整体行使著作权时,会因为平台对内容合集享有的数据权益而受到不合理的限制,甚至给著作权行权造成实质性阻碍。
总之,对无体物赋权产生人为的垄断,需要不断平衡公共利益和私有权益,在其间走钢丝,这与以“保护正当竞争”为价值取向动态的竞争观上,综合考察市场竞争秩序、商业道德、消费者权益和经营者利益的《反不正当竞争法》裁判规则,亦有重合之处。
对于原始的、公开的内容合集,应当根据个案的具体情况,综合考察各方权益。
例如,对于随机抓取海量原始公开内容的合集,存在赋权的可行性。随机抓取的海量原始内容,因抓取随机性,集合内部的内容状态混乱,事实上难以考察所有的原始发布用户,不会对用户的行权带来阻碍;且因权利源头不可考,合法地逐一使用其中的单一内容存在困难;同时,仅在抓取内容累积到较大数量后,才能够获得市场竞争优势。对该等内容合集赋权,不会不当侵蚀公有领域或用户的法定权利,又能够对先发平台提供有限的合理保护,存在赋权的合理性。
但对于来源清楚,集合内部明确、有条理,权属清晰的原始公开内容合集,对内容集合进行赋权,会事实上使得平台的权益凌驾于原创用户的著作权等权利之上,必须获得用户和平台的双重授权,甚至三重授权后才能使用,不当地限制了用户的法定权利,打破了各方的权益平衡,赋权应当极为谦抑和审慎。
总之,数据作为具有时代性的、新兴的无体物,应当审慎考察对其赋权的合理性和正当性,与之具有相似性的知识产权赋权理论路径可以提供经验和参考;对于原始的、公开的内容合集是否赋权,需要平衡为社会公众保留的公有领域、在先法定权利和新设私有权益等多重权益,避免落入“劳动财产权说”的窠臼,避免仅因付出劳动就对数据予以赋权,而应该根据具体情况在个案中审查、平衡和裁量,而这才是法官智慧真正作为的地方。
05—原始公共数据判决案例分析
本案例为深圳市中级人民法院二审审结的数据产权案件。
首先,结论是:对于涉及公共利益的原始、公开数据,若数据处理者仅通过简单劳动收集数据,并未作出实质性贡献,通常不享有单独的权益。
案情简介:
融某公司的A平台和智某公司的B平台均提供港股孖展数据信息。两平台数据均来自与券商的合作及自互联网公开网页等渠道的收集。公证书显示,两平台数据在多个方面相同。其他港股孖展数据平台与A平台合作,而B平台数据来源标注为互联网。A平台指控B平台爬取其数据,未经许可对外提供,违反商业道德,构成不正当竞争。
一审法院/案号 | 广东省深圳市福田区人民法院 (2021)粤0304民初33616号 | ||||||
二审法院/案号 | 广东省深圳市中级人民法院 (2022)粤03民终4682号 | ||||||
案由 | 不正当竞争纠纷 | ||||||
二审合议庭 | 审判长 蒋筱熙 审判员 张 婷 审判员 兰诗文 | ||||||
书记员 | 徐娟(兼) | ||||||
当事人 | 上诉人(一审被告):深圳智某服务有限公司,住所地广东省深圳市福田区****,统一社会信用代码****。 法定代表人:王某,总经理。 委托诉讼代理人:罗四维,北京植德(深圳)律师事务所律师。 委托诉讼代理人:肖楚逸,北京植德(深圳)律师事务所实习律师。 | ||||||
被上诉人(一审原告):深圳前海融某有限责任公司(曾用名深圳市融某有限公司),住所地广东省深圳市前海深港合作区****,统一社会信用代码****。 法定代表人:刘*,执行董事。 委托诉讼代理人:王珂,广东信达律师事务所律师。 委托诉讼代理人:黄万洲,北京市京师(深圳)律师事务所律师。 | |||||||
一审裁判结果 | 一、智某公司于判决生效之日起十日内赔偿融某公司经济损失20000元及合理开支30000元; 二、驳回融某公司的其他诉讼请求。 | ||||||
二审裁判结果 | 一、撤销广东省深圳市福田区人民法院(2021)粤0304民初33616号民事判决; 二、驳回深圳前海融某有限责任公司的全部诉讼请求。 | ||||||
二审裁判时间 | 二〇二三年十二月三十一日 | ||||||
涉案法条 | 《中华人民共和国反不正当竞争法》第二条、第十七条,《中华人民共和国民法典》第一百七十九条,《中华人民共和国民事诉讼法》第六十四条第一款、第一百四十二条,《中华人民共和国民事诉讼法》第六十七条第一款、一百七十七条第一款第(二)项 |
裁判要点:
深圳市中级人民法院二审裁判认为,首先,涉案数据产品是由不同券商在特定港股新股发行期间的孖展金额和息率的多次更新数据集合,孖展金额反映了市场对港股新股的接受度,是投资者关注的重点,属于港股打新领域的基础信息资源,不应被单一市场主体垄断。其次,涉案数据为单一信息的直接记载,是原始数据,在发布后即处于自由流通状态,为公开数据。数据非A平台原创,也未显示融某公司付出创造性劳动。
最后,无证据显示融某公司独占合法获取数据的权利,或最早获得数据,融某公司的数据统计行为仅为简单计算,未体现高度劳动价值,其请求确认权益的正当性不足。此外,证据未证明智某公司数据来源于爬取融某公司数据。二审法院因此撤销一审关于智某公司不正当竞争的判决,驳回融某公司的全部诉讼请求。
参考意义:
本案例针对原始数据集合,从促进数字经济长期发展和粤港澳大湾区产业创新的角度,平衡数据处理者的劳动价值和社会公众的信息获取自由,指出在涉及公共利益的原始、公开数据处理上,不应轻易赋予权益,以免造成反公地悲剧。
本案提出了符合产业发展规律的解决方案,合理确定了企业数据赋权的例外情况,丰富了数据权益保护规则的探讨和研究,展示了人民法院在保护粤港澳大湾区数字金融产业发展方面的有益尝试。
06—小结
今天内容比较理论化,有点枯燥。我们做个小结。
一、对原始、公开数据赋权的合理性和正当性应谨慎考虑,因为数据作为当代特征性新兴的无体物,其权益保护与知识产权等智力成果类似,都是无体物。长期以来,财产权主要是有体物的权利,而数据类无体物的权利界定较为复杂。数据的无排他性和无消费竞争性使得对其赋权与传统财产权有所不同,需考虑是否促进社会整体利益。
二、什么样的数据能被赋权?专家指出,应保护经过加工、处理后能为市场主体利用的衍生数据,而自动生成的、非结构性的原始数据不在保护范围之内。此外,受保护的数据应是大规模数据而非静态单向的小数据。然而,这两个特征并不能完全解决数据赋权的问题,例如,具有独创性的数据产品本就受著作权法保护,而原始数据被排除在保护范围之外,是否能充分实现立法目的,值得怀疑。
三、公共数据应该如何和企业数据区分赋权?目前,公共数据和企业数据的区分标准较为清晰,两者具有不同的收集主体、收集对象和收集目的,应当构建不同的法律规则。然而,对于个人数据,我国法律已有明确规定,不应纳入数据赋权范畴。
四、UGC数据如何赋权?UGC平台中的原始、公开内容集合是否应赋权,是一个复杂的问题。一方面,互联网平台在数据的收集、存储、传输等方面投入了经营成本,数据合集也能为平台带来竞争利益;另一方面,原始数据集合的赋权可能对市场和经济发展带来负面影响。因此,需要根据具体情况,在个案中进行细致的审查、平衡和裁量。
五、原始公共数据判决案例解析。本案中,深圳市中级人民法院认为,对于涉及公共利益的原始、公开数据,数据处理人仅对数据附加简单劳动予以收集,未作出新的实质性贡献的,其对该等数据一般不享有单独权益。这一判决体现了对于原始、公开数据赋权的审慎态度,旨在保护社会公众获取公共信息的权利,促进数据资源的合理利用。
—————————————————————————
数据资产化,鼹鼠哥与你一起。