临床医疗大数据治理框架

笔者从事医疗信息化多年,而今医疗大模型正当风头无两,而实际落地的应用门可罗雀。无论如何,大模型将是未来的行业的重要方向,而沉淀在各大医疗机构的临床数据极有可能在未来发挥更大的价值,在此梳理医疗大数据治理体系,仅作学习记录,欢迎同行专业人士阅后探讨与指点。

笔者认为医疗大数据治理分为以下4个方面:数据集成,数据存储,数据清洗,数据应用,以下分别从这几个方面分别进行简要介绍。

1 数据集成

1.1 通用数据模型设计

由于国内医疗信息化行业的厂商较多,医院内分散着众多来自不同厂商的信息系统,因此医院的数据平台建设首先要做的便是将不同系统中的数据进行集成,包括HIS CIS RIS EMR LIS 等。数据集成过程是一个脏活、累活,原因是不同信息系统之间对于同一个字段的数据存储格式可能不同,且业务系统的数据标准化程度不高,其设计本身只是为了满足临床的业务需求,可能根本不会关注数据质量,因此数据模型设计的通用程度就显得非常重要。OMOP针对临床科研出了一份通用数据模型(CDM),但对于国内的可适配性较差,因此需要结合国内的实际情况,进行通用数据模型的设计。
CDM的设计需要首先要考虑的问题是要集成哪些数据,临床业务数据库中所有的表数据是否都要无脑接入,当然不是!像业务系统的配置表信息、操作日志、操作过程记录等一般不会关注,通用数据模型关注的是特定的时刻医务人员出于对患者进行健康关怀而进行一系列操作的结果,例如翼医生为患者开具处方,在通用数据模型中的体现是一张处方的结果,而对于审方的流程所涉及到过程不会关注。

1.2 数据集成方式

数据集成一般分为以下几种方式:开库,接口,视图
开库:即对方厂商提供生产库或备份库的只读账号,直接对接数据库,通过ETL工具进行数据抽取。
接口或视图:厂商本身有一套提供数据的接口、视图 或 处于收费目的而开发的
对接效率上,一般开库的效率最高,视图或接口调试周期相对较长

2 数据存储

2.1 业务数据库

临床业务数据库通常采用传统的关系型数据库来存储,如SQLSERVER,MySQL、ORACLE,这三种关系型数据库语法区别不大,入门难度低,方便运维,有较好的稳定性。也有部分HIS厂商如某华用的是国外的一款数据库,在国内比较小众,这个对DBA不太友好,跳槽难度较大…
总而言之,临床业务数据库一般采用传统的关系型数据库,稳定性较好,基于关系模式进行数据库设计。为了提高查询效率,对于一些大表会进行分库分表的操作,例如只存储今年的数据,往年的数据分开存储。

2.2 数据仓库

很多人可能联想到医院的历年来的数据量非常大,集成到一个地方传统的关系型数据库肯定hold不住。在笔者看来,基于单体医院数据中心的数据库选择,传统的关系型数据库完全可以cover。除却影像文件之外,普通三甲医院近10年的数据量,过滤掉一些配置数据、日志记录、审计数据,数据量在1-3T之间,部分大表完全可以采用分表的方式来解决,个人推荐PG。

3 数据清洗

数据清洗依然是一个比较耗费精力的体力活,原因是数据清洗的标准往往是企业内部制定的,尚未形成行业标准。而制定企业内部的数据标准本身就是一件复杂且涉及到多方角色的事情,需要让研发、产品、数据治理团队之间的达成共识,在共识的标准基础上进行产品设计、产品研发和数据清洗才会让各个角色工作开展的更加顺畅。但现实往往为了赶进度,产品研发或者数据清洗工作在没有形成标准的时候已经开始,当产品正式上线时,产研团队和数据治理团队就开始上演“谁是大厨”的戏码。
笔者认为,数据清洗主要包含以下几个部分:数据维度清洗(患者维度,就诊维度)、数据类型统一(数据类型转换、脏数据过滤)、小字典映射(例如 性别,婚姻状态等)、大字典映射(如诊断、检验等字典)。
数据清洗不是一次性工作,清洗到何种程度没有标准,会随着产品需求或认知的变化而迭代,前期需要把数据维度统一、类型统一、基本的编码名称映射做完。

4 数据应用

当下医疗数据的主要应用于临床科研、医疗质控、统计报表。
讲真,由于数据质量问题,临床数据应用于科研还有很长的路要走,需要医生、信息化厂商共同重视数据质量,才能发挥医疗数据的价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/653964.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言之猜凶手

一、题目 日本某地发生了一件谋杀案,警察通过排查确定杀人凶手必为4个嫌疑犯的一个。 以下为4个嫌疑犯的供词: A说:不是我。B说:是C。C说:是D。D说:C在胡说 已知3个人说了真话,1个人说的是假话。 现在…

产品解读 | 新一代湖仓集存储,多模型统一架构,高效挖掘数据价值

星环科技TDH一直致力于给用户带来高性能、高可靠的一站式大数据基础平台,满足对海量数据的存储和复杂业务的处理需求。 同时在易用性方面持续深耕,降低用户开发和运维成本,让数据处理平民化,助力用户以更便捷、高效的方式去挖掘数…

Python tkinter (9) ——Menu控件

本文主要是Python tkinter Menu菜单控件介绍及使用示例。 tkinter系列文章 python tkinter窗口简单实现 Python tkinter (1) —— Label标签 Python tkinter (2) —— Button标签 Python tkinter (3) —— Entry标签 Python tkinter (4) —— Text控件 Python tkinter (5…

计算机毕业设计 基于SpringBoot的校园闲置物品交易系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ 🍅文末获取源码联系🍅 👇🏻 精…

springboot(ssm医院疫情防控系统 疫苗核酸预约系统Java系统

springboot(ssm医院疫情防控系统 疫苗核酸预约系统Java系统 开发语言:Java 框架:springboot(可改ssm) vue JDK版本:JDK1.8(或11) 服务器:tomcat 数据库:mysql 5.7&a…

多场景建模:腾讯3MN

3MN: Three Meta Networks for Multi-Scenario and Multi-Task Learning in Online Advertising Recommender Systems 背景 推荐领域的多场景多任务学习:维护单模型即可节省资源也可节省人力;各个场景的数据共享,理论上面学习是更加充分的 …

微信小程序Skyline在手机端不渲染的问题之一及其解决方式

问题:电脑端是skyline渲染,手机端是webview渲染?如何解? 开发者工具 当前渲染模式:Skyline 当进行预览时手机端却是: 请注意看轮播图的显示情况 请注意看轮播图的显示情况 请注意看轮播图的显示情况 从轮播图上来看,手机端是webview渲染…

“有国才有家”这个观点应该怎么理解?

​《有国才有家》这首歌由马仕健作词作曲,蒋国佳编曲,刘畅混音,马仕健演唱。 “家是最小国,国是千万家”。千百年来,“家国”这两个词一直紧紧联系在一起。“国家好,民族好,大家才会好”&#x…

【嵌入式学习】C++QT-Day3-C++基础

笔记 见我的博客:https://lingjun.life/wiki/EmbeddedNote/19Cpp 作业 设计一个Per类,类中包含私有成员:姓名、年龄、指针成员身高、体重,再设计一个Stu类,类中包含私有成员:成绩、Per类对象p1,设计这两个类的构造函…

Linux文件管理(下)

上上篇介绍了Linux文件管理的上部分内容,这次继续将 Linux文件管理的剩余部分说完。内容如下。 一、查看文件内容 1、cat 命令 1.1 输出文件内容 基本语法: cat 文件名称主要功能:正序输出文件的内容。 eg:输出 readme.txt文…

力扣0112——路径总和

路径总和 难度:简单 题目描述 给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 。判断该树中是否存在 根节点到叶子节点 的路径,这条路径上所有节点值相加等于目标和 targetSum 。如果存在,返回 true ;否则&#xf…

对Spring当中AOP的理解

AOP(面向切面编程)全称Aspect Oriented Programminge AOP就是把系统中重复的代码抽取出来,单独开发,在系统需要时,使用动态代理技术,在不修改源码的基础上,将单独开发的功能通知织入(应用)到系统中的过程,完…

git从clone到pr的全流程

在使用 Git 和 GitHub 进行协作时,从克隆(clone)一个仓库到创建拉取请求(Pull Request,简称 PR)的全流程通常包括以下步骤: 1. 克隆远程仓库 首先,你需要将远程仓库克隆到你的本地…

chatgpt搭建

chatgpt两步搭建大法 部署docker环境 下载docker curl -fsSL https://get.docker.com -o get-docker.sh安装docker sh get-docker.sh运行docker服务 systemctl start docker查看运行状态 systemctl status docker设置docker开机自启 systemctl enable docker部署chatgpt…

慎投!这3本期刊诚信风险高,被警告和风险低的期刊选哪个?

近年来,学术界对学术诚信的关注越来越多,期刊的学术诚信风险也日益受到关注。科睿唯安在今年三月份剔除的35本SCI期刊中,绝大多数涉及学术诚信问题!据官方介绍,其已正式开发了一款AI工具,可以锁定存在学术诚…

【JavaScript 基础入门】01 编程语言和计算机基础

编程语言和计算机基础 目录 编程语言和计算机基础1 - 编程语言1.1 编程1.2 计算机语言1.3 编程语言1.4 翻译器1.5 编程语言和标记语言区别1.6 总结 2 - 计算机基础2.1 计算机组成2.2 数据存储2.3 数据存储单位2.4 程序运行 1 - 编程语言 1.1 编程 编程: 就是让计算…

微信小程序(二十二)获取全局实例

注释很详细,直接上代码 上一篇 新增内容: 1.全局实例的定义位置 2.全局实例中数据的修改方法 源码: app.js App({//数据可以包括在第二级globalData:{userInfo:null,token:1243,userInfo:null},//globalData并不是关键词,数据可以…

预制菜春节大洗牌,味知香、千味央厨谁是“硬菜”?

2024年春节预制菜销量走俏,预制菜依然是消费者“年夜饭”上的重头戏。各大生鲜平台、电商、商超、餐饮门店都纷纷开卖春节预制菜。 预制菜赛道两大“玩家”:“预制菜第一股”味知香(605089.SH)、“餐饮供应链第一股”千味央厨(001215.SZ)均在…

jrt运维命令改造

以前发布网站都是定死网站放置路径的,现在JRT想面向更广范围推广,所以就不能明确确定网站放置目录,为此需要改造一下jrt命令和sh来满足目录不确定情况和多个程序用不同管理命令的要求。 以前是写死的,现在改为调程序运行目录的sh…

在Mixamo网站上,下载的模型导入unity后没有材质怎么解决

在Mixamo网站上,下载的模型导入unity后没有材质 1.导入的模型没有材质2.解决方法3.提取后就有材质了 1.导入的模型没有材质 2.解决方法 选中导入的模型 > 选择提取纹理>选择你要提取到的文件夹(默认是当前文件夹)>点击 fix now 3.提取后就有材质了