科技云报道:两会热议的数据要素,如何拥抱新技术?

科技云报道原创。

今年全国两会上,“数字经济”再次成为的热点话题。

2024年政府工作报告提到:要健全数据基础制度,大力推动数据开发开放和流通使用;适度超前建设数字基础设施,加快形成全国一体化算力体系;推动解决数据跨境流动等问题。

这为我国数据要素市场的进一步发展指出了方向。

与此同时,如何进一步推动数据要素市场化配置,也成为代表委员们热议的话题。

目前,数据的价值已经成为业界共识。然而,从产业视角来看,数据要素的供给和流通使用、数据资源的联动和配置等课题的探索才刚刚开始;从企业视角来看,数据质量保障、合规化使用路径、高价值场景挖掘等难点仍然普遍存在。
在这里插入图片描述
那么,围绕数据要素相关议题,2024年两会代表们给出了哪些提案?在实践中,又有哪些技术能够助力数据要素的价值进一步释放?

“数据要素”两会提案逐步细化

为激活数据要素的价值和潜能,今年初国家数据局等17部门联合印发了《“数据要素×”三年行动计划(2024—2026 年)》。

近日,国家数据局又联合多部门下发通知,宣布开展全国数据资源情况调查,全面调研国内数据资源生产存储、流通交易、开发利用、安全等情况。

这标志着我国数据要素市场建设正在从“顶层设计”走向“实践探索”阶段。

面对如何推动数据要素市场化配置、产业数字化转型等现实问题,今年两会期间,多位人大代表和政协委员也积极建言献策。

全国政协委员、南方科技大学副校长金李指出,当前数据要素市场建设仍存在一些问题,例如国家级数据交易所建设滞后、“用数”的环境与氛围尚未形成、数据跨境流通探索力度有待增强、国家级算力基础设施建设力度有待加强等。

全国政协委员、北京国家会计学院教授秦荣生指出,当前我国数据交易市场处于初始发展阶段,面临数据交易市场分割、交易规模不大、数据安全合规难以保障、数据交易质量参差不齐、数据交易监管薄弱等难点问题,围绕数据交易产生的争议也日渐增多。

全国政协委员、京东集团技术委员会主席、京东云事业部总裁曹鹏带来了国产化数字基础设施发展相关的建议。

他认为,构建国产化数字基础设施迫在眉睫,软硬协同才能最大化发挥算力底座的作用。

同时,应推动采用云原生、容器化、分布式的新型国产算力底座,通过发展先进算力实现技术革新升级。

全国政协常委、中国工程院院士、中国科学院大连化学物理研究所所长刘中民建议,通过推进数据确权、推动数据定价、规范交易场所、增设算力枢纽、统筹宏观布局等,进一步做好数据要素市场化配置改革工作。

作为数学家、统计学家,全国政协委员、中国科学院院士陈松蹊指出,中国目前尤为缺乏高质量的再分析科学数据集,建议组建由领域与数据科学家组成的数据融合团队,实现科学数据自立自强。

同时,企业构建数据文化需要有数据科学团队,必须从加强数据分析人才培养入手。

从多份数据要素相关提案来看,今年的议题依然重点聚焦在数据立法、数据要素市场化、数据确权和定价、数据安全和监管等方面。

但随着数据数据要素市场培育进展加速,今年提案在各个方向上进一步细化,例如,针对如何统筹数据交易所,如何开展数字基础设施建设、保障数据质量,如何通过技术手段保障数据确权,如何进行数据人才培养等,都有了更为具体的方案建议。

事实上,数据要素市场培育是一个宏大的课题,涉及体制机制、市场流通、产品研发、标准规范等多层次的深度探索,而在探索过程中无疑会不断涌现出新模式、新业态,而这些全新的实践背后,都有政策、市场、技术、资源等多项因素的共同推动。

数据要素创新成果落地

数据要素作为我国战略布局与发力的重要领域,全国各地各市场主体都在积极寻找数据要素发展中的定位和角色,寻找新的业务增长点。尽管目前尚未形成成熟的方法论和推广模式,但数据要素市场建设已有一些创新成果落地。

例如,人工智能发展驱动数据要素市场需求爆发。伴随着大模型时代的到来,通用人工智能(AGI)产业正迎来爆发期,更加需要大规模、高质量、多样化的数据集提升模型效果和泛化能力。

然而,我国人工智能领域高质量数据集缺乏、数据供给的产业生态不健全、企业数据资源获取成本高等问题依然严峻。

2023年5月,我国达成了首笔基于大模型训练数据集的数据交易。

北京国际大数据交易所与北京市科学技术研究院进行科学数据专区建设运营合作签约,打造了全国首个专门针对科技领域数据交易流通的专题数据区域。

同期,北京市发布的《促进通用人工智能创新发展的若干措施(2023-2025年)》提出,针对当下大模型训练高质量中文语料不足导致的中文语境应用落地问题,要归集高质量基础训练数据集,并通过北京国际大数据交易所开放多模态语料库。

不仅如此,人工智能的发展使高性能算力资源存在巨大缺口,亟需统一规划建设算力交易中心,协调优质算力资源,实现统一调度和最优匹配。

以运营商中国电信为例,在网络基础设施方面,中国电信建设了5G共享基站超过120万站,发布“灵泽2.0数据要素平台”,汇集高质量数据资源构建基础积累,打造“2+3+2”产品体系赋能千行万业,构建“数据要素交易+可信流通计算与共享+运营管理支撑”三大模块,提供全流程数据交易服务。

在算力基础设施方面,中国电信形成“2+4+31+X+O”梯次分布、云边协同的泛在算力基础设施体系。

“一城一池”覆盖超过240个城市,边缘算力节点超过800个,天翼云算力总规模达3.8EFLOPS。

2023年2月24日,宁夏联合中国电信、北京国际大数据交易所、中科曙光等机构,打造的国内首个一体化算力交易调度平台——东数西算一体化算力服务平台正式上线。

在推进数据安全共享和发挥数据价值方面,隐私计算技术持续推动政务数据的合规安全流通,支撑公共数据在小微普惠服务场景的应用。

例如,深圳福田区的公共数据隐私计算平台,是广东省首个基于全信创架构融合了可信执行环境(TEE)、多方安全计算(MPC)两种隐私计算技术路线的平台,构建了一个多方数据安全融合计算环境。

基于该隐私计算平台,5家金融机构与福田区政务服务数据管理局,签约达成公共数据开发利用合作关系。

在保障各参与方数据安全的前提下,促进“政政”“政企”之间的数据价值共享互惠,打破原有的高价值数据因敏感度高而形成的数据壁垒,实现有条件共享的数据基于“原始数据不出域、数据可用不可见”的流通新范式。

数据要素发展推动技术变革

事实上,在数据要素赋能行业场景的实践中,技术发展支撑着产业进步,而业务需求也对技术提出新的要求。随着数据规模爆炸式增长、数据类型日渐丰富,传统大数据处理技术面临着诸多挑战,数据技术体系也在不断变革创新。

中国信通院《数据要素白皮书(2023年)》指出,数据要素在强调通过大数据处理投入生产的同时,进一步突出了数据在交易流通过程中产生经济价值。

可控、可计量、可流通是数据要素对数据技术提出的新要求,新技术不断涌现为数据要素价值释放保驾护航。

例如,以云原生、软硬协同以及湖仓一体等技术为代表的数据处理技术,持续助力用户降本增效。

云原生技术通过存储计算分离架构,实现资源池化和极致弹性,具备高扩展性、高可用性、跨地域规模、低成本等优势,可为用户提供真正具备秒级智能弹性扩容能力、随需而动。

软硬协同技术为软件技术带来了新的机遇。一些企业陆续发布GPU数据库、数据库一体机等产品,以满足业务规模不断扩张的需求。

硬件技术的发展一方面促进了数据处理技术性能提升,另一方面也推动了数据处理技术与其他新兴技术的融合,使得技术体系的安全性和智 能性得到提升。

在湖仓一体方面,数据仓库(Data Warehouse)和数据湖(Data Lake)两项技术在不断演进过程中逐渐融合形成湖仓一体(Data Lakehouse)技术架构。

湖仓一体集数据湖的灵活性、可扩展性优势以及数据仓库的数据结构和数据管理功能于一体,能够降低数据冗余、减少存储成本,提升数据处理时效性。

当前,湖仓一体技术落地应用速度持续加快,应用领域主要集中在互联网、电信运营商以及金融等国内数字化程度较高行业。

由于数据要素具有规模经济性,企业将趋向于持续积累数据,能够助力企业降本增效的技术将会进一步受到关注。

此外,以人工智能、隐私计算、区块链、图技术等为代表的新兴技术,持续护航数据要素安全流通,例如:

向量数据库能够支撑AI技术赋能数据要素价值释放。

一些非结构化数据需要通过机器学习算法从中提取出以向量为表示形式的“特征”,向量数据库的兴起便是为了解决对这些向量进行存储与计算的问题。

图分析技术助力洞察数据连接新价值。

数据要素时代,数据规模将会不断增大,数据量及数据自身丰富度不断增加,图分析技术能够有效分析数据之间的关联性以及处理数据之间的复杂关系。

隐私计算与区块链相结合,能够实现数据密态流转。

在控制面以区块链为核心构建数据流通管控层;在数据面以隐私计算为核心构建密态数联网。

数据流转过程中以密态形式流通,保障其流转、计算、融合直到销毁的全链路安全可控,同时将数据要素持有权和使用权分离,实现数据可用不可见、使用可控可计量、以及使用权跨域管控。

图联邦技术能够打破数据孤岛。

图联邦技术是为了解决数据孤岛、隐私保护和数据安全问题提出的概念,在保护用户隐私和公司数据的前提下,更好地发挥数据价值。

时空大数据平台或时空数据库实现海量时空数据管理、查询、统计与分析。

在现实世界中有超过80%的数据都和地理位置(空间)相关,而所有数据均含有时间属性。因此,实际业务场景中许多数据需要通过时空大数据平台或时空数据库来处理。

近年来,时空大数据平台以及时空数据库等技术的发展,有效应对北斗时空大数据服务、数字孪生、智慧城市等新兴数据应用业务场景下对于时空数据处理的需求。

未来,新兴技术还将在应用过程中不断融合以适应不同场景下的技术需求,向着更加高效、安全的方向不断发展。

可以预见,围绕数据的采集、存储、计算、管理、流通、安全各个环节,技术体系将不断革新。

结语

我国正从“数据大国”向“数字中国”全速前进,数据要素与新兴技术交织融合,数据价值与行业发展相互交错,数据引擎正在被注入巨大动能。面向未来,在落实数据基础制度和建设数字中国的新篇章中,数据要素的价值将被更加充分的挖掘,我国数据要素的发展也将迎来新的突破。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/744987.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试经典-11-接雨水

题目 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。 示例 1: 输入:height [0,1,0,2,1,0,1,3,2,1,2,1] 输出:6 解释:上面是由数组 [0,1,0,2,1,0,1,3,2,…

2024自动化测试的痛点与发展趋势!

前几天在技术交流群里,大家讨论了很多关于自动化测试落地面临的痛点和如何创造价值的话题,颇有感触。 自动化测试这个话题,从出现到在国内大规模开展实践,有很长的一段时间了。早期,大家对自动化测试的理解和使用目的…

java:学生管理系统

一、介绍 该功能是实现学生信息的添加,查看,修改,删除以及退出系统的简单操作。 二、代码实现 public class Student {private String sid;//学号private String name;//姓名private String age;//年龄private String address;//地址publi…

通过NFS 实现windows共享linux目录

一、配置WIndows 1.进入程序和功能 2.勾选NFS服务,安装客户端 二、安装NFS Service 在ubuntu 1.查看apt源是否存在nfs服务端安装包 sudo apt-cache madison nfs-kernel-server 2. 安装nfs-kernel-server sudo apt install nfs-kernel-server 3.建立共享目录&…

Compose UI 之 BottomAppBar 底部应用栏

BottomAppBar 底部应用栏 BottomAppBar 是一个在 Jetpack Compose 中用于创建底部应用栏的组件。它提供了一个高度可定制且功能丰富的底部导航解决方案。 它的使用方式与 TopAppBar 类似。下面的图是 BottomAppBar 的基本样式图。 常见使用场景 BottomAppBar 在应用中常用于…

人工智能课题、模型源码

人工智能研究生毕业~深度学习、计算机视觉、时间序列预测(LSTM、GRU、informer系列)、python、人工智能项目代做和指导,各种opencv图像处理、图像分类模型(vgg、resnet、mobilenet、efficientnet等)、人脸检…

ESD静电测试闸机-筑成电子厂防静电管理的第一道防线

ESD静电测试闸机是一种用于防止静电对电子产品和设备造成损害的重要设备。在电子厂等对静电敏感的场所,ESD静电测试闸机扮演着防静电管理的第一道防线的角色,确保生产环境的安全和产品质量的稳定。本文将从静电监测和消除、刷卡/身份证认证、指纹/人脸识…

Tengine编译安装

首先下载源码 可以去官网:The Tengine Web Server 当前最新版地址:https://tengine.taobao.org/download/tengine-3.1.0.tar.gz 安装编译依赖 yum -y install gcc pcre-devel zlib-devel openssl-devel libxml2-devel \libxslt-devel gd-devel GeoIP…

一款前端开发工具Hbuilder

背景:最近日在接触前同事留下的一个VUE项目(只有前端代码,后台服务压根没写真不知道以前是怎么糊弄过去的)时,发现一款可以快速开发前端的软件;今日分享一下。 当我打开项目时发现,有个app.vue…

【Cookie和Session辨析】

1.cookie 1.1什么是cookie Cookie 是一种在客户端(通常是 Web 浏览器)和服务器之间传递信息的机制,用于在客户端存储少量的数据。它由服务器发送到客户端浏览器,然后浏览器会将这些数据存储在本地,并在后续的请求中将…

解决安装PyMuPDF(也被称为fitz库)的问题(可成功安装且使用)

解决安装PyMuPDF(也被称为fitz库)的问题(可成功安装且使用) 安装方法:一些安装时报错的原因解析:报错1:报错2:报错3-无效的分发包警告:报错4: 使用实例 在使用…

电子学会 2023.03 Python 3级(yanpuxin)

十进制数111转换成二进制数是? 1、十进制数111转换成二进制数是?( ) A 111 B 1111011 C 101111 D 1101111 正确答案:D 试题解析: 十进制转二进制,采用除二倒取余数,直到商为0为止。 2、某班有36人…

YOLO v8:目标检测的最新王者

本文来自公众号“AI大道理” —————— Yolov8是Yolo系列模型的最新王者,各种指标全面超越现有目标检测模型。 Yolov8借鉴了Yolov5、Yolov6、YoloX等模型的设计优点,全面改进了Yolov5模型结构,同时保持了Yolov5工程化简洁易用的优势。 …

hex文件格式解析

本文框架 1. hex文件格式1.1 数据长度1.2 地址域1.3 数据类型1.4 数据域1.5 CRC校验域 本文对hex文件格式进行解析,介绍各部分组成及其含义,在此mark下,方便后续开发脚本对hex文件进行操作。 1. hex文件格式 Intel HEX文件是由一行行符合Int…

Vue3调用钉钉api,内嵌H5微应用单点登录对接

钉钉内嵌H5微应用单点登录对接 https://open.dingtalk.com/document/isvapp/obtain-the-userid-of-a-user-by-using-the-log-free 前端需要的代码 1、安装 dingtalk-jsapi npm install dingtalk-jsapi2、在所需页面引入 import * as dd from dingtalk-jsapi; // 引入钉钉a…

使用vscode+clangd+bear+publickeyssh远程开发Linux程序

目录 配置ssh密钥远程登录登录远程Linux主机安装必要软件安装vscode插件1.安装remote-ssh插件2.通过vscode远程连接到linux机器3.在远程安装插件clangd4.关闭C/C Intellense engine 使用vscodeclangdbear1.修改Makefile2.编译内核3.结果 配置ssh密钥远程登录 一定要配置成密钥…

暗光增强——IAT网络推理测试(详细图文教程)

IAT模型由两个独立的分支组成,局部分支用于像素调整,并输出两个用于加法和乘法的特征图。全局分支用于全局调整并输出颜色矩阵和gamma值,全局分支受DETR启发,网络通过动态查询学习的方式更新颜色矩阵和gamma值。整个模型只有超过9…

Pytorch入门实战 P2-CIFAR10彩色图片识别

目录 一、前期准备 1、数据集CIFAR10 2、判断自己的设备,是否可以使用GPU运行。 3、下载数据集,划分好训练集和测试集 4、加载训练集、测试集 5、取一个批次查看下 6、数据可视化 二、搭建简单的CNN网络模型 三、训练模型 1、设置超参数 2、编…

【CSP试题回顾】201709-3-JSON查询

CSP-201709-3-JSON查询 解题思路 1. 初始化数据结构 map<string, string> strContent: 存储字符串类型属性的内容。键是属性名&#xff08;可能包含通过点.连接的多级属性名&#xff09;&#xff0c;值是属性的字符串值。vector<string> keyVec: 存储当前正在处…

【DAY11 软考中级备考笔记】数据结构 排序操作系统

数据结构 排序&&操作系统 3月14日 – 天气&#xff1a;晴 今天天气非常热&#xff0c;已经到20度了&#xff0c;春天已经来了。 1. 堆排序 堆排序的思想是首先建立一个堆&#xff0c;然后弹出堆顶元素&#xff0c;剩下的元素再形成一个堆&#xff0c;然后继续弹出元素&…