数据如何才能供得出、流得动、用得好、还安全

众所周知,数据要素已经列入基本生产要素,同时成立国家数据局进行工作统筹。目前数据要素如何发挥其价值,全国掀起了一浪一浪的热潮。
随着国外大语言模型的袭来,国内在大语言模型领域的应用也大放异彩,与此同时,数据价值在大模型中如何度量也成为了难题。一直以来,区块链被诟病为诈骗工具,在数据要素时代,区块链作为数据流通的权益证据链,可以较好的支撑。得到蔡钰·商业参考3《AIGC会让区块链重焕生机吗?》中提到:

但到了今天,普通人创作的普通内容在预训练AI模型的过程中也可以有了价值,以及各类生成式模型又极大降低了平民创作的门槛,我的观点也开始有了一些改变。未来三年,区块链技术可能会以超乎我们想象的速度成为主流应用。在那之前,你作为普通人,记得好好留言、好好创作,保护好自己的数字版权。

由此可以看出,数据供得出、流得动、用得好需要一种安全机制来保证。对于UGC、PGC而言,因为内容本是公开的,那么通过公开的区块链是可以较好的记录引用、转载的链接,并实现价值链条。

然而,对于政府和企业数据,则问题要复杂得多!且不论复杂情况下的数据如何流动,对于有价值的数据如何发挥价值,也是比较困难的。对于数据提供方而言,首先需要考虑的问题是,是不是真的有价值。这里的价值其实是对收获的价值和所承担的风险+投入成本。

数据“流得动”效用公式

数据收益之和 > 数据供出成本 + 数据交易成本 数据收益之和 > 数据供出成本+数据交易成本 数据收益之和>数据供出成本+数据交易成本

数据收益之和>数据供出成本+数据交易成本
要想数据流动,需要整体流通效益大于成本。数据收益之和大于数据供出成本和数据交易成本之和,数据才能流得动。
数据收益来源于采用数据流通模式获得的价值减去现有旧模式的价值和替换新模式所需成本。要么做大新模式价值,要么探索全新领域。

交易成本由维护市场和基础设施成本构成,只能通过交易量来摊薄成本。一是通过增加供给和需求,二是拓展应用场景,三是拓展服务边界。通过增加数据收益,降低供出成本和交易成本,实现数据流得动。

供得出

数据供得出的条件:
预期收益>预期损失 预期收益>预期损失 预期收益>预期损失
供出成本需要满足数据收益减去投入成本和风险成本。投入成本确定性比较高,风险如果不加分类分级,趋于无穷大。例如:公共数据运营的投入成本不可控,风险成本难估算,需要重点解决。
解决方案:一是通过建设运营移交(BOT)模式减少投入成本,二是通过分类分级压低潜在风险。

供出成本

V 数据 = V 收益 − C 投入 − C 风险 > 0 V_{数据}=V_{收益} - C_{投入}-C_{风险}>0 V数据=V收益C投入C风险>0

收益价值

● 确定性收益
● 未来潜在收益

投入成本

● 数据采购成本
● 数据供出的服务器成本
● 数据加工成本

风险成本

● 数据泄露风险()
● 数据安全风险
● 数据隐私风险

交易成本

C 交易 = C 维护市场 + C 基础设施 C_{交易}=C_{维护市场}+C_{基础设施} C交易=C维护市场+C基础设施
交易成本中基础设施成本和维护市场成本属于硬性成本,只能通过交易量来摊薄。
通过增加供给和需求用户数量,提高数据交易频次;拓展应用场景,扩大交易体量;拓展服务边界,增大交易规模

维护市场成本

● 交易所上架费用
● 广告成本
● 人员成本和管理成本

基础设施成本

数据交易机构需要提供承载数据交易发布的建筑和线上交易场所,这些都属于基础设施投入。相对固定,且边际效用递减。

流得动

数据流得动的条件:
V 数据流动收益压差 = ∑ D ∈ P V C i − V D P = V D P → D C > 0 V C i 表示从第 i 位消费者获得的收益 ∑ D ∈ P V C i 则表示所有从生产者 P 的数据 D 获得的所有收益之和 V D P 表示为提供数据 D ,生产者 P 需要付出的成本 \begin{align} V_{数据流动收益压差} & =\sum_{D \in P} V_{C_i} - V_{D_P}=V_{D_P \to D_C}>0 \\ \\ & V_{C_i} 表示从第i位消费者获得的收益 \\ & \sum_{D \in P} V_{C_i} 则表示所有从生产者P的数据D获得的所有收益之和 \\ & V_{D_P} 表示为提供数据D,生产者P需要付出的成本 \end{align} V数据流动收益压差=DPVCiVDP=VDPDC>0VCi表示从第i位消费者获得的收益DPVCi则表示所有从生产者P的数据D获得的所有收益之和VDP表示为提供数据D,生产者P需要付出的成本
基于上述公式,可以做大消费者的数量,使得总的数据消费收益变大,而生产者付出的成本相对固定,使得数据流通收益压差大于0,这样才能实现数据流得动。

用得好

V 数据价值 = V 新体验 – V 旧体验 – C 替换成本 > 0 V_{数据价值}=V_{新体验}–V_{旧体验}–C_{替换成本}>0 V数据价值=V新体验V旧体验C替换成本>0

按照俞军产品体验公式, 用户价值 = 新体验 − 旧体验 − 替换成本,或者效应 − 成本> 0 用户价值 = 新体验 - 旧体验 - 替换成本,或者 效应 - 成本 > 0 用户价值=新体验旧体验替换成本,或者效应成本>0
成本包括:直接成本和间接成本。
(1)直接成本,包括付出的金钱成本、时间成本、隐私数据、态度等;
(2)交易成本,即为了促成交易,付出的搜寻成本(比如为了找到哪个音乐软件最适合自己,甚至尝试用几个付出的时间)、议价成本(为了买到更便宜的西红柿和摊贩讨价还价付出的时间和口舌)、学习使用的成本、保障成本等。

数据能否用得好,关键在于新体验的增量是否足够。数据要素的交易模式,典型属于新体验模式,旧体验模式可能是目前已经构建的数据使用模式。例如通过爬虫获取数据、通过合同方式购买第三方数据或者模型。新体验主要在效率、实时性、准确性等方面好于就体验模式。

另一方面,如何使得替换成本尽可能的低,也是确保用得好的一个重要方面。例如,通过提升工具能力,降低用户替换成本。

总之,数据要想流得动,需要从供给、流通和消费来思考成本效益最低的解决方案。从数据交易流通的情况分析,是否流得动是关键。只有聚集足够的需求,才能撬动足够的供给,是一个典型的平台交易结果。20年前的淘宝,10年前的美团,都是需要通过补贴使得供需匹配,并提高效率。在数据交易场景中,不同时刻,对供需两方的场景要求不同。现阶段,各大数据交易所还是属于上架供给数据为主,消费者还很难使用目前的数据。

笔者认为,如果有足够的数据供给,应该会有消费者出现。不过基于上述从消费者角度来看,数据收益需要客户旧模式的价值,以及投入替换成本,这个过程往往比较困难。除非,应用场景的新模式具有压倒性的优势。

以上是笔者对于数据如何交易的一些思考,欢迎大家讨论,不妥之处,欢迎拍砖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/788857.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用docker部署MongoDB数据库

最近由于工作需要搭建MongoDB数据库:将解析的车端采集的数据写入到数据库,由于MongoDB高可用、海量扩展、灵活数据的模型,因此选用MongoDB数据库;由于现公司只有服务器,因此考虑容器化部署MongoDB数据,特此…

db2 使用jdbc建立连接时,指定schema,schema不存在也会连接成功

使用db2想指定schema,使用语句如下 jdbc:db2://" hostname ":" port "/" databaseName ":currentSchema" this.databaseSchema ";"; 切记:最后的分号一定要有,否则报错。 但是此处有…

Android手势密码–设置和校验功能的实现代码

效果图如下,大家感觉不错请参考实现代码 具体代码如下所示: private void setGesturePassword() {toggleMore.setOnCheckedChangeListener(new CompoundButton.OnCheckedChangeListener() {Overridepublic void onCheckedChanged(CompoundButton button…

【linux】lsof命令使用

1. 功能 lsof list open files, 列出被进程所使用的文件名称。 2. 基础语法 3. 参数含义 参数含义-a过滤出多个选项要同时满足的文件-U仅列出UNIX-like系统的socket文件类型。-u指定用户,比如-u atiaisi,会把用户atiaisi相关的进程使用的文件列出来。…

24/04/02总结

API: bigdecima: 方法名 说明 public static BigDecimal valueof( double val) 静态获取对象 public BigDecimal add(BigDecimal val) 加法 public BigDecimal subtract(BigDecimal val…

【路径规划论文整理(1)】Path Deformation Roadmaps(附带对PRM改进算法、同伦映射的整理)

本系列主要是对精读的一些关于路径搜索论文的整理,包括了论文所拓展的其他一些算法的改进思路。 这是本系列的第一篇文章: Jaillet, Lonard & Simon, Thierry. (2008). Path Deformation Roadmaps: Compact Graphs with Useful Cycles for Motion Pl…

Spring Boot接收从前端传过来的数据常用方式以及处理的技巧

一、params 传参 参数是会拼接到url后面的请求 场景规范:url后面的key值<=3个参数的时候,使用params 传参 支持的请求方式:get(正规的是get方式)、post 都行 例如: http://localhost:8080/simpleParam?name=Tom&age=10 在postman里面的体现为 后端接收的接口…

格式化输出数据

JDK 5 新特性&#xff0c;格式化输出数据 长度不够前面补空格&#xff0c;超出长度按实际输出 System.out.printf(“格式控制部分”,表达式1,表达式2,,表达式n); 格式控制部分由格式符号、普通字符组成&#xff0c;普通字符原样输出&#xff0c;格式符号输出表达式的值 // …

Python+requests+Pytest+logging+allure+pymysql框架详解

一、框架目录结构 1)tools目录用来放公共方法存储,如发送接口以及读取测试数据的方法,响应断言 数据库断言 前置sql等方法;2)datas目录用例存储接口用例的测试数据,我是用excel来存储的数据,文件数据 图片数据等;3)testcases目录用来存放测试用例,一个python文件对应…

Python网络爬虫(一):HTML/CSS/JavaScript介绍

1 HTML语言 1.1 HTML简介 HTML指的是超文本标记语言&#xff1a;HyperText Markup Language&#xff0c;它不是一门编程语言&#xff0c;而是一种标记语言&#xff0c;即一套标记标签。HTML是纯文本类型的语言&#xff0c;使用HTML编写的网页文件也是标准的文本文件&#xff0c…

天盾网络验证源码+视频教程

最新版本为746&#xff0c;企业定制版。现在正在意义上的离线版已出来&#xff0c; 天盾746离线版不需要绑定电脑&#xff0c;提供母端&#xff0c;断网可用&#xff0c;可以理解为它是一款离线版的工具。它没有任何使用限制&#xff0c;和正版唯一的区别就是不需要连接作者服…

789. 数的范围 (二分学习)

题目链接 1.确定一个区间&#xff0c;使得目标值一定在区间中 2.找一个性质满足&#xff1a; &#xff08;1&#xff09;性质具有二段性 &#xff08;2&#xff09;答案是二段性的分界点 3.整数二分&#xff08;处理红色右端点和绿色左端点&#xff09; //代码1&#xff1a;…

Aop实现公共字段自动填充

文章目录 1、问题:2.常规冗余不利于维护操作&#xff1a;3.实现思路&#xff1a; 2、步骤&#xff1a;搭建一个简单的SpringBootMyPlus项目:表结构&#xff1a; 1. 依赖&#xff1a;2. 配置连接信息:3. 创建三层架构&#xff1a;4. 代码开发:4.1 **定义数据库操作类型枚举**4.2…

MySQL之索引详细总结

索引简介 索引是帮助MySQL高效获取数据的数据结构(有序)。在数据之外&#xff0c;数据库系统还维护着满足特定查找算法的数据结构&#xff0c;这些数据结构以某种方式引用(指向)数据&#xff0c;这样就可以在这些数据结构上实现高级查法&#xff0c;这种数据结构就是索引 为什…

基于rip环境下的MGRE综合实验

实验要求 1、R5为ISP&#xff0c;只能进行IP地址配置&#xff0c;其所有地址均配为公有IP地址。 2、&#xff08;1&#xff09;R1和R5间使用PPP的PAP认证&#xff0c;R5为主认证方。 &#xff08;2&#xff09;R2与R5之间使用ppp的CHAP认证&#xff0c;R5为主认证方。 &#…

YoloV8改进策略:Neck改进|GCNet(独家原创)|附结构图

摘要 本文使用GCNet注意力改进YoloV8,在YoloV8的Neck中加入GCNet实现涨点。改进方法简单易用&#xff0c;欢迎大家使用&#xff01; 论文:《GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond》 非局部网络&#xff08;NLNet&#xff09;通过为每个查…

ElasticSearch7.8的下载与安装和Kibana 7.8.0工具使用安装

1、ElasticSearch7.8.0下载 elasticsearch: 官方下载地址&#xff1a;https://www.elastic.co/cn/downloads/elasticsearch 链接: https://pan.baidu.com/s/1wAKQoB3nhLhcnBlPfVOLxQ 提取码: t83n kibana: 链接: https://pan.baidu.com/s/156aD9zDdvUv8LFgDEIPoSw 提取码:…

PSCAD的使用

1. Canvas Settings中设置母线电压监测和虚拟连线十分重要。 2. Project Settings中snapshot可以实现分段仿真。 3. .out文献导出数据

操作系统—读者-写者问题及Peterson算法实现

文章目录 I.读者-写者问题1.读者-写者问题和分析2.读者—写者问题基本解法3.饥饿现象和解决方案总结 II.Peterson算法实现1.Peterson算法问题与分析(1).如何无锁访问临界区呢&#xff1f;(2).Peterson算法的基本逻辑(3).写对方/自己进程号的区别是&#xff1f; 2.只包含意向的解…

图神经网络实战(7)——图卷积网络(Graph Convolutional Network, GCN)详解与实现

图神经网络实战&#xff08;7&#xff09;——图卷积网络详解与实现 前言1. 图卷积层2. 比较 GCN 和 GNN2.1 数据集分析2.2 实现 GCN 架构 小结系列链接 前言 图卷积网络 (Graph Convolutional Network, GCN) 架构由 Kipf 和 Welling 于 2017 年提出&#xff0c;其理念是创建一…