【概率统计】生存分析

什么是生存分析


激励例子:新药的临床试验

想象一下,有一种新药被开发出来,可以延长某种恶性癌症患者的生命。为了评估药物的有效性,需要进行临床试验,对患者进行一段时间的跟踪,看看他们开始治疗后能活多久。

以下是如何使用生存分析来设置和分析试验:

  1. 招募:招募100名癌症患者,并在招募当天开始治疗。

  2. 随访:对每个患者进行一段时间的跟踪,以查看他们是否以及何时去世。由于疾病和试验的性质,并不是每个患者的终点(死亡)将在研究期间观察,因为:

    -一些患者可能在研究结束时还活着。
    -有些人可能因为各种原因离开研究或失去随访。

  3. 数据收集:5年后,研究结束,收集数据。假设5位患者的数据如下所示(为例进行了简化):

患者ID时间(年)事件
12.51
250
311
431
540

-时间:从研究开始到死亡或结束的时间。
-事件:二元指标,1表示事件(死亡)发生,0表示审查(研究结束时患者没有发生该事件)。

  1. Kaplan-Meier估计器:我们使用它来估计生存函数( S(t) ),它告诉我们患者在过去一段时间内生存的概率( t )。

  2. 分析:我们可以看看中位生存时间,50%的患者已经去世,并将其与未用药患者的历史数据进行比较,以评估药物的有效性。


生存分析的必要性

以下是在这种情况下需要生存分析的原因:

  • 审查:并非所有患者的事件都被观察到。一些人失去了随访,另一些人在研究结束时仍然活着。生存分析方法可以处理这种类型的不完整数据。

  • 事件发生时间:感兴趣的结果不仅是事件是否发生,而且是何时发生。传统的分析,如逻辑回归,没有考虑时间方面。

  • 比较组:如果有一个对照组,我们可能想要比较两组的生存经验。生存分析提供了log-rank检验等工具,可以在统计学上比较生存曲线。

  • 协变量调整:患者的特征,如年龄、癌症阶段和其他治疗都会影响生存率。生存分析方法,如Cox比例风险模型,可以针对这些协变量进行调整。

这种分析的结果可以影响临床决策,指导病人护理,并为进一步的研究提供信息。在ML和AI的背景下,我们可以将更复杂的模型应用于这些数据,以潜在地揭示复杂的关系,并对患者结果做出更准确的预测。

生存分析中最经典、使用最广泛的统计学方法是Cox比例风险模型,由David Cox在1972年开发。它是一个半参数模型,用于处理患者的生存率和几个解释变量之间的关系。


Cox比例风险模型的主要特征:

  • 半参数化:模型对基线风险函数的形状没有假设,即所有协变量都等于零时的风险。这允许建模时间到事件数据的灵活性。

  • 比例风险:它假设解释变量对风险的影响是乘性的,并且随着时间的推移保持不变。随着时间的推移,任何两个个体的风险比率是恒定的,因此称为“比例风险”。

  • 多协变量:模型可以同时处理多种风险因素和协变量,包括连续的和分类的。

Cox模型公式:

对于一个个体 i i i和协变量 x i x_i xi,在时间 t t t时的风险函数 h ( t ) h(t) h(t)为:

h i ( t ) = h 0 ( t ) exp ⁡ ( β 1 x i 1 + β 2 x i 2 + … + β p x i p ) h_i(t) = h_0(t) \exp(\beta_1 x_{i1} + \beta_2 x_{i2} + \ldots + \beta_p x_{ip}) hi(t)=h0(t)exp(β1xi1+β2xi2++βpxip)

其中:

  • h i ( t ) h_i(t) hi(t) :个人 i i i t t t时间的危害。
  • h 0 ( t ) h_0(t) h0(t) :时间$ t $时的基线危险度,即所有协变量均为零的个体的危险度。
  • β 1 , β 2 , … , β p \beta_1, \beta_2, \ldots, \beta_p β1,β2,,βp :协变量的系数,衡量协变量对风险的影响。
  • x i 1 , x i 2 , … , x i p x_{i1}, x_{i2}, \ldots, x_{ip} xi1,xi2,,xip:单个 i i i的协变量值。

解释:

-系数 β j \beta_j βj大于零,表示随着协变量 x j x_j xj的增加,事件危害增加,意味着事件发生的预期时间缩短。
-系数 β j \beta_j βj小于零意味着随着协变量 x j x_j xj的增加,事件风险降低,意味着事件发生的预期时间更长。

模型拟合:

Cox模型通常使用一种称为部分似然最大化的技术来拟合,这是一种有效处理截尾数据的方法。系数$ \beta 是在不指定基线危害 是在不指定基线危害 是在不指定基线危害h_0(t)$的情况下从数据中估计的,这使得模型是半参数的。

例子:

如果你想研究新疗对患者生存时间的影响,需要收集生存时间的数据,包括患者是否接受新疗(治疗组与对照组),以及可能影响生存的其他协变量,如年龄、阶段和吸烟状况。Cox模型允许您在控制这些其他因素的同时评估新疗的影响。

为什么它是经典:

Cox模型能够处理不同类型的协变量,处理筛选,并且不需要基线危害的规格说明,这使它成为生存分析工具包中通用而强大的工具。它在广泛的学科中使用,特别是在医学研究中用于临床试验分析和流行病学研究。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/580318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

嵌入式-stm32-SR04超声波测距介绍及实战

一:超声波传感器介绍 1.1、SR04超声波测距硬件模块 1.2、SR04的四个IO口 vcc:提供电源5V gnd:接地 Trig:是**发送**声波信号的触发器 Echo:是**接收**回波信号的引脚 当TRIG信号被触发时,传感器会发送一定频率的声波信号,该信号被反射后&am…

Android中_Service生命周期和AMS流程的创建

Service生命周期可以结合Android生命周期分析。 Service生命周期可以从两种启动Service的模式开始讲起,分别是context.startService()和context.bindService()。 Service的生命周期与启动和绑定状态相关。当调用startService()方法启动服务时,会执行onS…

【DeepLearning】Deep Residual Learning for Image Recognition恺神大作学习

[TOC] Deep Residual Learning for Image Recognition 论文 1. 文章主要想解决什么问题,用了什么方法 深度神经网络在训练过程中的3个关键问题: 梯度消失/爆炸问题:随着网络层数的增加,梯度在反向传播过程中可能会变得非常小&a…

Linux磁盘清理(/dev/vda1 100%)已解决

背景:linux上传资源的时候,size总是为0,或者有时候多文件上传,总是传到一半就失败了 原因:磁盘空间不够 查看磁盘空间命令 df -h结果发现 /dev/vda1 20G 19G 0 100% /none 4.0K 0 4.0K…

Hooked协议掀起WEB3新浪潮

随着区块链技术和加密货币的兴起,币圈已经成为全球范围内的一个热门领域。在这个充满机遇与挑战的行业中,Hook机制正逐渐成为一种重要的技术手段,为投资者、开发者以及相关机构提供了更多的选择和可能性。本文将详细介绍币圈中的Hook机制&…

腾讯云4核8G服务器三年优惠价格表

腾讯云轻量服务器4核8G12M有三年优惠价吗?有,但是不怎么优势,相对于云轻量2核2G4M带宽三年价格是540元、2核4G5M带宽3年优惠价756元,4核8G12M轻量应用服务器三年价格是5292元,怎么样?还想买吗?阿…

python3下载手机安卓版,python下载手机版最新

大家好,小编为大家解答python3下载手机安卓版的问题。很多人还不知道python下载手机版最新,现在让我们一起来看看吧! 1、先去python官网下载python3的源码包,网址:https://www.python.org/ 1)进去之后点击导航栏的Down…

ansible 备忘清单(一)

笔者: 把以前的手写笔记电子化吧,顺便当作复习。 基础命令 命令 参数 备注 ansible --version 查看版本号 ansible-doc --help 查看帮助信息 -l |--list 查看所有模块 -s 查看模块摘要 Ansible servers -I |-…

Linux、Windows命令行查看服务、进程是否存在、存活

Linux 服务 查看服务状态 systemctl is-active <serviceName>示例 [rootcurry platform]# systemctl is-active mysqld active [rootcurry platform]# systemctl is-active mysqld1 unknown返回状态 active failed unknown 不存在此服务 进程 查看所有进程名称 …

浅谈数据仓库运营

一、背景 企业每天都会产生大量的数据&#xff0c;随着时间增长&#xff0c;数据会呈现几何增长&#xff0c;尤其在系统基建基础好的公司。好的数据仓库需要提前规划和好的运营&#xff0c;才能支持企业的发展&#xff0c;为企业提供数据分析基础。 二、目标 提高数据仓库存储…

2024 Android保活总结

本文介绍的方案都是无需用户主动开启权限的。如果需要用户主动开启权限或者加白名单之类的话保活的意义就不大了&#xff0c;毕竟用户不大可能主动原因让app一直在后台运行 常规的方案 OnePixelActivity 1&#xff0c;监听SCREEN_OFF启动一个像素的Activity&#xff0c;灭屏…

前端发展趋势:WebAssembly、PWA 和响应式设计

目录 前言 WebAssembly&#xff1a;超越JavaScript的性能 渐进式Web应用&#xff08;PWA&#xff09;&#xff1a;离线可用和更好的用户体验 响应式设计&#xff1a;适应多种设备 总结 作者简介&#xff1a; 懒大王敲代码&#xff0c;计算机专业应届生 今天给大家聊聊前端…

软件测试面试题——如果保证测试用例覆盖率

如何提高测试用例覆盖率&#xff1f; 在项目的初期&#xff0c;我们参与到需求评审中 1. 覆盖显性需求 需求文档或原型图上已经标注清楚的功能一定要全部覆盖&#xff0c;通过思维导图工具进行梳理一般都能保证。 2. 获取隐含需求 隐含需求的获取是一大难点&#xff0c;但需求就…

iOS - 钥匙串(keychain)中的证书没有右三角,无法导出p12文件

如下图&#xff0c;证书左侧没有小三角形&#xff0c;无法导出 .p12文件 我遇到的问题是&#xff0c;因为CSR文件有问题&#xff0c;只需要重新在钥匙串上重新导出一个CSR文件&#xff0c;然后再重新制作证书即可

SQL使用从入门到优化:目录

一、基础篇 SQL基础&#xff1a;SQL 介绍和数据库基础 SQL基础&#xff1a;操作环境搭建 SQL基础&#xff1a;表的增删改 SQL基础&#xff1a;记录的增删改查 SQL基础&#xff1a;查询的基本使用 SQL基础&#xff1a;范围查询 SQL基础&#xff1a;章节小结 二、进阶篇 …

力扣69. x 的平方根

二分查找 思路&#xff1a; 设置 left 指针为 0&#xff0c;right 指针为 x&#xff1b;如果 mid (right - left) / 2 left 的平方小于或等于 x&#xff0c;此时移动 left mid 1&#xff0c;并缓存当前 mid 值&#xff0c;可能这个 mid 就是结果&#xff0c;或者 x 的平方…

web前端html笔记2

新增状态标签<meter><progress> <meter> 属性 值 描述 high 数值 规定高值 low 数值 规定低值 max 数值 规定最大值 min 数值 规定最小值 optimum 数值 规定最优值 value 数值 规定当前值 <body> <meter high"50" …

Mongodb中一个有趣的数值查询案例

Mongodb集合中并没有强制所有文档具有统一的结构和字段类型。这样宽松的文档结构管理方法&#xff0c;给新数据的插入和以有数据的修改带来了极大的便利。但数据类型的频繁修改&#xff0c;可能参数查询和处理上的问题。 数值类型的变化&#xff0c; 是mongodb面临的一个问题之…

论文降重隐藏字符怎么识别 papergpt

大家好&#xff0c;今天来聊聊论文降重隐藏字符怎么识别&#xff0c;希望能给大家提供一点参考。 以下是针对论文重复率高的情况&#xff0c;提供一些修改建议和技巧&#xff0c;可以借助此类工具&#xff1a; 论文降重隐藏字符的识别方法 一、引言 在论文降重过程中&#xff…

创建ROS的软件包服务器

创建ROS的软件包服务器 前提 1台有公网ip的服务器, 最好有域名 服务器配置 连接到服务器 ssh root域名或ip创建要存放包的路径 mkdir -p /var/ros/ubuntu安装必要的软件 sudo apt update sudo apt install nginx dpkg-dev gnupg在自己的主机编译好ros包, 具体可以看使用自定…