数据治理006-数据标准的管理

元数据的分类和标准有哪些?

一、元数据的分类

元数据可以根据其描述的对象和属性不同,被分为不同的类型。以下是几种常见的元数据分类方法:
基于数据的类型:根据数据的类型,元数据可以被分为结构化元数据、非结构化元数据、半结构化元数据等。
基于数据的来源:根据数据的来源,元数据可以被分为内部元数据和外部元数据。内部元数据来自于组织内部的业务系统和数据仓库,而外部元数据则来自于外部的数据源,如政府公开数据、第三方数据等。
基于元数据的应用场景:根据元数据的应用场景,元数据可以被分为电子商务元数据、社交媒体元数据、金融服务元数据等。

二、元数据的标准

为了更好地管理和控制元数据,需要建立统一的元数据标准。元数据标准化的目的是为了实现不同系统之间的数据共享和互操作,提高数据处理效率和质量。以下是几种常见的元数据标准:
ISO/IEC 11179:ISO/IEC 11179是一种国际标准的元数据规范,它定义了元数据的概念、属性、关系和规则。ISO/IEC 11179包括三个部分:元数据的规范、元数据的注册和元数据的交换。
Dublin Core:Dublin Core是一种用于描述网络资源的元数据标准,它包括15个核心元素,如标题、描述、创作者、发布日期等。Dublin Core被广泛应用于数字图书馆、数字遗产、数字出版等领域。
EDIMA:EDIMA是一种用于电子数据交换的元数据标准,它定义了电子单据的结构和内容。EDIMA包括三个部分:EDI对象模型、EDI元数据规范和EDI报文规范。
JSON LD:JSON LD是一种用于描述网络资源的轻量级元数据标准,它可以将JSON格式的数据映射为RDF格式的数据。JSON LD被广泛应用于语义网、知识图谱等领域。

总之,元数据的分类和标准是元数据管理的重要基础。通过对元数据进行分类和标准化,可以更好地描述和理解数据的属性、特征和关系,促进不同系统之间的数据共享和互操作,提高数据处理效率和质量。
同时,为了更好地管理和控制元数据,还需要引入元数据管理平台。元数据管理平台可以帮助组织统一管理元数据,包括元数据的采集、清洗、存储、查询、分析和可视化等。通过元数据管理平台,可以更好地保证元数据的准确性、完整性和一致性,提高数据处理的质量和效率。

数据标准的管理

2024年全国数据工作会议,国家数据局局长刘烈宏表示,将建立健全国家数据标准化体制机制,研究成立全国数据标准化技术委员会,统筹指导我国数据标准化工作,加快研究制定一批数据领域国家和行业标准。

将加强标准引领,印发国家数据标准体系建设指南,指导发布数据要素流通标准化白皮书。

数据标准是企业在提升数据质量过程中不可或缺的要素。

数据标准涉及对数据的命名、定义、结构和取值的规范,为数据的内外部使用和交换提供一致性和准确性的保障。

数据标准的定义

数据标准的权威定义可以参考一些国际标准组织和权威机构的定义,以下是两个常用的权威定义

1、ISO/IEC 11179

ISO/IEC 11179 是一个关于元数据注册的国际标准。根据该标准,数据标准被定义为:

“数据标准是关于数据的内容、格式和结构的规则和指南,用于确保数据的一致性、准确性和完整性。”

2、DAMA(数据管理协会)定义

DAMA是一个权威的数据管理专业组织,根据 DAMA 数据管理知识体系(DAMA-DMBOK),数据标准被定义为:

“数据标准是用于定义、管理和控制数据的一致性和质量的规范、指南和规则。这些标准包括数据定义、数据格式、数据命名和数据编码等方面。”

在这里插入图片描述

数据标准的维度分类

数据标准的构成维度涵盖标识、定义、关系、表示和附加等类别。
在这里插入图片描述

数据标准的重要性

数据标准统一了数据的命名、定义和格式,使数据更加规范和实用。

增强数据的一致性和准确性:数据标准化确保了数据在不同系统和应用中的一致性,减少了由于数据歧义导致的错误。
促进数据的共享和交换:通过标准化的数据格式和定义,数据可以在不同部门和系统之间无缝流动,提高数据利用率。
提高数据管理效率:标准化的数据管理使数据的维护和更新更加高效,降低了管理成本。
增强数据的安全性和合规性:数据标准包括对数据敏感性和版本控制的管理,确保数据在使用和保护方面符合相关法规和政策。
统一基础数据:便于业务数据的汇总、报送、分析应用。

数据标准建立的要求

制度保障先行:应在制度中明确各个角色以及定义相应的分工界面,固化管理流程,为制定数据标准、管理数据标准提供指导性意见。
归口部门发挥牵头作用:归口管理部门需积极发挥带头作用,推动和监督标准管理流程的执行。通过激励和问责考核体系,推进数据标准工作的制定与执行落地。
自上而下、自下而上:制定过程中一方面需要自下而上梳理信息系统中的数据情况,同时也需要自上而下定义数据主题、细化分类,两者结合才能实现全面整体的数据视图,形成有效的数据规范要求。
实际需求为根本:需要明确以需求为根本,根据业务实际个性化的制定数据标准,避免造成难以落地的情况。

ISO/IEC 11179元数据注册标准

提供了用于定义元数据注册的框架,旨在基于数据的精确定义,从数据元素开始,实现元数据驱动的数据交换。(尝试着在网上找11179这套标准的详细内容,没有找到)

元数据项类型:在对元数据进行管理维护时,则存在被管理的元数据项。一般常见管理的元数据项分为分类模式、概念域、数据元概念、数据元、值域、表示类型等。在GB/T 18391 / ISO/IEC 11179中规定了列出部分元管理项的类型(见图1),同时也支持以附件类型进行添加和扩展。
在这里插入图片描述
元数据模型:用来描述元数据的模型通常称为元模型,改为:是指人们对描述元数据以及元数据之间关系理解的表达,也称为概念模型。如在进行数据元的管理维护时,通用使用GB/T18391 / ISO/IEC 11179中推荐的数据元的元数据模型(见图2)。该模型由概念层和表示层两部分组成,概念层包括数据元概念类和概念域类,都表示概念;表示层包括数据元类、值域类,都表示数据值的容器。
在这里插入图片描述

什么是数据元?

在GB/T 18391(ISO/IEC 11179)中,有一组属性规定其定义、标识、表示和允许值的数据单元,也称为数据元素。在一定语境下,构建一个语义正确、独立且无歧义的特定概念语义的信息单元,同时可理解为数据的基本单元。一个数据元由数据元概念和表示组成。

数据元概念:数据概念是能以一个数据元的形式表示的概念,其描述与任何特定表示法无关。一个数据元概念由以下两部分组成:
a. 对象类:可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽象概念或现实世界中事物的集合;
b. 特性:一个对象类所有成员所共有的特性,

表示:由值域、数据类型、计量单位(如何需要)、表示类型(可选)组成。
在这里插入图片描述

我国卫生信息元数据相关标准

我国卫生信息领域的元数据相关标准也都是在参考GB/T 18391 / ISO/IEC 11179《信息技术 元数据注册系统》的基础之上,结合卫生信息领域的元数据特性进行针对性扩展。目前已发布的元数据项类型有:数据元、值域、数据集、统计指标。

1、数据元

我国卫生信息数据元目录标准17个部分,包括1份总则和16份不同类别的数据元内容。已发布的数据元相关标准清单如下:
在这里插入图片描述
该标准规范中,将数据元的允许值分为可枚举和不可枚举两种类型:

可枚举值域:由允许值列表规定的值域,每个允许值的值和值含义成对表示,分为可选值较少的、可选值较多的两种。
a. 可选值较少的(如3个或以下):在数据元属性中直接列举;
b. 可选值较多的(如3个以上):在数据元属性中写出所引用的值域代码,若为外部标准,则注明标准号;
不可枚举值域:由描述规范的值域,且在数据元属性中准确描述该值域的允许值;

2、值域代码

我国卫生信息数据元值域代码标准分为17个部分,包括1份总则、1份标识规则和15份不同类别的值域代码内容。已发布的值域代码相关标准清单如下:
在这里插入图片描述

3、数据集

我国卫生信息领域中,为了满足各业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含的最小数据元素的集合,即基本数据集。

目前,我国卫生信息基本数据集分为基本信息、卫生服务、卫生管理、卫生综合四大类,其中卫生服务又分为儿童保健、妇女保健、疾病控制、疾病管理、医疗服务五小类;每个分类下包括多个数据集,如卫生综合分类下包括1份居民健康档案基本数据集和17份电子病历基本数据集。已发布的基本数据集相关标准清单如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
我国卫生信息卫生统计指标标准分为9个部分,包括1份总则和8份不同类别的卫生统计指标内容。已发布的统计指标相关标准清单如下:
在这里插入图片描述

引用:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/55281.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SQL连接Python

对于运营部门的Yoyo来说,她想要知道夜曲优选的订单都来自哪些省份,每个省份的总订单数以及总订单金额分别是多少。 这时小鹿就会通过SQL对连接的数据库进行查询,再将结果传递给Python处理,并帮助Yoyo生成可视化图表。 我们先来快…

拆解维修飞科剃须刀

原因 用了好几年的剃须刀,经过一次更换电池。后来上面的盖帽松动,无法合盖,经过把弹片矫正后修复。最近一次”大力出奇迹“的操作直接断送了这个老伤员最后的可能性。最终只能花了将近十块大洋买了一套盖着和中间座。简单更换了一下。 记录…

单元测试进阶-Mock使用和插桩

目录 一、基本概念 1、Mock 2、插桩(Sutbbing) 二、参考文章 一、基本概念 1、Mock Mock的作用就是不直接new对象,而是使用Mock方法或者注解Mock一个对象。 这个对象他不是new创建的对象,Mock对该对象的一些成员变量和方法…

【RabbitMQ 项目】服务端:消费者管理模块

文章目录 一.概念辨析1.什么是消费者?2.服务端为什么要管理消费者?3.怎么管理消费者?4.需要管理生产者吗? 二.编写思路1.定义消费者2.定义队列消费者管理管理类3.定义消费者管理类 三.代码实践 一.概念辨析 1.什么是消费者&#…

html嵌入百度地图

html嵌入百度地图 key地址 https://lbsyun.baidu.com/apiconsole/key#/home &#xff0c;点进去注册应用、然后复制key换掉即可显示地图 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>百度地图搜索…

C++随心记 续一

C中的模板 在其它语言中如Java或者C#中可能叫做泛型&#xff0c;在C中为模板&#xff0c;泛型的限制通常比模板多。模板可以解决多次的代码重复问题&#xff0c;如以下场景 #include <iostream> #include <string>void print(int value) {std::cout << val…

MySQL存储和处理XML数据

文章目录 一、实战概述二、准备数据三、实战步骤1、创建数据库2、创建数据表3、插入XML数据4、查询XML数据5、修改XML数据6、删除XML数据7、注意事项四、实战小结一、实战概述 MySQL不直接支持XML数据类型,但可以通过TEXT或BLOB类型字段存储XML数据,利用ExtractValue和Update…

Spark Job 对象 详解

在 Apache Spark 中&#xff0c;Job 对象是执行逻辑的核心组件之一&#xff0c;它代表了对一系列数据操作&#xff08;如 transformations 和 actions&#xff09;的提交。理解 Job 的本质和它在 Spark 中的运行机制&#xff0c;有助于深入理解 Spark 的任务调度、执行模型和容…

滚雪球学Oracle[8.3讲]:区块链与Oracle

全文目录&#xff1a; 前言一、Oracle Blockchain的架构与应用1.1 Oracle Blockchain的基本架构1.1.1 Oracle Blockchain的核心组件 1.2 Oracle Blockchain的优势示例&#xff1a;Oracle Blockchain的实际应用 二、区块链与传统数据库的集成2.1 区块链与传统数据库的关系2.2 区…

PWM:控制信号的秘密武器

什么是PWM&#xff1f; PWM&#xff08;Pulse Width Modulation&#xff0c;脉宽调制&#xff09;是一种通过改变信号的占空比来控制电压输出的技术。简单来说&#xff0c;PWM信号由一系列高低电平组成&#xff0c;通过调节高电平持续的时间比例&#xff0c;可以控制信号的平均…

目前最好用的爬虫软件是那个?

作为一名数据工程师&#xff0c;三天两头要采集数据&#xff0c;用过十几种爬虫软件&#xff0c;也用过Python爬虫库&#xff0c;还是建议新手使用现成的软件比较方便。 这里推荐3款不错的自动化爬虫工具&#xff0c;八爪鱼、亮数据、Web Scraper 1. 八爪鱼爬虫 八爪鱼爬虫是一…

ARM base instruction -- ccmp

Conditional Compare (register) sets the value of the condition flags to the result of the comparison of two registers if the condition is TRUE, and an immediate value otherwise. 条件比较&#xff08;寄存器&#xff09;如果条件为真&#xff0c;则将条件标志的值…

Linux:深入理解冯诺依曼结构与操作系统

目录 1. 冯诺依曼体系结构 1.1 结构分析 1.2 存储结构分布图 2. 操作系统 2.1 概念 2.2 如何管理 2.3 什么是系统调用和库函数 1. 冯诺依曼体系结构 1.1 结构分析 不管是何种计算机&#xff0c;如个人笔记本电脑&#xff0c;服务器&#xff0c;都是遵循冯诺依曼结构。…

[leetcode]674_最长连续递增序列

给定一个未经排序的整数数组&#xff0c;找到最长且 连续递增的子序列&#xff0c;并返回该序列的长度。 连续递增的子序列 可以由两个下标 l 和 r&#xff08;l < r&#xff09;确定&#xff0c;如果对于每个 l < i < r&#xff0c;都有 nums[i] < nums[i 1] &am…

可视化图表与源代码显示配置项及页面的动态调整功能分析

可视化图表与源代码显示配置项及页面的动态调整功能分析 文章目录 可视化图表与源代码显示配置项及页面的动态调整功能分析1.分析图表源代码2.分析源代码显示功能**完整代码参考&#xff1a;** 3.分析源代码显示及动态调整**完整代码参考&#xff1a;** 4.分析代码编辑器及运行…

【AI知识点】泛化(Generalization)与过拟合(Overfitting)

泛化&#xff08;generalization&#xff09; 是机器学习中的一个核心概念&#xff0c;指的是模型在训练数据之外的新数据上表现得如何。换句话说&#xff0c;泛化能力衡量的是模型能否在未见过的样本上做出正确的预测或推断。 1. 泛化的背景 当我们训练机器学习模型时&#…

华为云LTS日志上报至观测云最佳实践

华为云LTS简介 华为云云日志服务&#xff08;Log Tank Service&#xff0c;简称 LTS&#xff09;&#xff0c;用于收集来自主机和云服务的日志数据&#xff0c;通过海量日志数据的分析与处理&#xff0c;可以将云服务和应用程序的可用性和性能最大化&#xff0c;为您提供实时、…

vue框架和uniapp框架区别

文章目录 vue框架和uniapp框架区别一、引言二、Vue.js 概述1、Vue.js 简介1.1、特点 2、适用场景 三、Uni-app 概述1、Uni-app 简介1.1、特点 2、适用场景 四、区别与比较1、跨平台能力2、开发体验3、性能优化4、社区和支持 五、总结 vue框架和uniapp框架区别 一、引言 在前端…

基于SSM的爱心慈善公益网站的设计与实现

文未可获取一份本项目的java源码和数据库参考。 选题意义 随着经济的不断进步&#xff0c;发展各种进行公益事业的渠道不断的出现&#xff0c;作为一个礼仪之邦&#xff0c;中华民族一直秉承先人的团结与友善精神&#xff0c;对社会和他人给予帮助关怀。但中国的公益事业相对…

【AIGC】2022-CVPR-利用潜在扩散模型进行高分辨率图像合成

2022-CVPR-High-Resolution Image Synthesis with Latent Diffusion Models 利用潜在扩散模型进行高分辨率图像合成摘要1. 引言2. 相关工作3. 方法3.1. 感知图像压缩3.2. 潜在扩散模型3.3. 调节机制 4. 实验4.1. 关于感知压缩权衡4.2. 利用潜在扩散生成图像4.3. 条件潜在扩散4.…