使用R语言生成CDISC SDTM.AE domain

写在前面

- 使用的是Rstudio

- 其实R已经有生成sdtm相关的package,以下代码仅作为练习R语言的语法,不是高效生成sdtm的方法

- 代码中没有解决的问题包括:EPOCH相关的逻辑没有考虑partial date的情况;在使用arrange() function做-SEQ排序时,关于大小写英文字母的排序机制似乎与SAS语言的sort function有所不同,导致使用相同的排序变量,通过R和SAS排序后,record的顺序会有不同;输出xpt结果是乱码,暂时输出到csv文件中。

- 还没有写生成SUPPAE的代码

- 代码参考了以下材料

Generating .xpt files with SAS, R and Python

https://www.pharmasug.org/proceedings/2021/EP/PharmaSUG-2021-EP-057.pdf

Yotube @mycsg

mycsg TASKS-SDTMGEN

以下是R代码

setwd('C://R_software')
library(haven)
library(dplyr)
library(tidyverse)
library(sas7bdat)
library(SASxport)
library(Hmisc)

# import source data
raw_ae_001 <- read_sas('C://rawdata/ae_001.sas7bdat')
raw_meddrathsaurus <- read_sas('C://rawdata/meddrathesaurus.sas7bdat')
sdtm_dm <- read_sas('C://sdtmdata/SDTM/DM.sas7bdat')
sdtm_se <- read_sas('C://rawdata/SE.sas7bdat')

# Update the variable name to uppercase, because var name is case sensitive in R
names(raw_ae_001) <- toupper(names(raw_ae_001))
names(raw_meddrathsaurus) <- toupper(names(raw_meddrathsaurus))

# Filter ae raw data with AETERM not missing, and keep necessary variables
ae <- raw_ae_001 %>%
  select(SUBJECT,RECORDPOSITION,AETERM,AESTDAT_RAW,AESTTIM,AEENDAT_RAW,AEENTIM,
         AESEV_STD,AESER_STD,AEACN_STD,AEREL_STD,AEREL_WD_STD,AEPATT_STD,AEOUT_STD,AESCONG_STD,
         AESDISAB_STD,AESDTH_STD,AESHOSP_STD,AESLIFE_STD,AESMIE_STD,AEONGO) %>% 
  filter(AETERM != "") 


# Update AETERM value to uppercase in order to merge with source MedDRA coding data
ae$AETERM <- toupper(ae$AETERM)

# Filter MedDRA source data with AE pannel only
meddra <- raw_meddrathsaurus  %>%
  filter(PANEL=="AE")

# Merge AE and MedDRA data (left join) by AETERM, create AESTDTC/AEENDTC 
ae1 <- merge (ae, meddra, by.x = c("AETERM"), by.y = c("VERBATIM"), all.x = T) %>%
  # create AESTDTC
  mutate(
    stdayn = suppressWarnings(as.numeric(word(AESTDAT_RAW,1))), ### as.numeric>>input, word>>scan
    stday = if_else(!is.na(stdayn), str_pad(stdayn, width = 2, pad = "0"), "-"), ### is.na>>not missing, !>>not, str_pad>>put xx.
    stmonthc = str_to_upper(word(AESTDAT_RAW, 2)), ### str_to_upper>>uppercase
    stmonth = case_when(
      stmonthc == "JAN" ~ "01",
      stmonthc == "FEB" ~ "02",
      stmonthc == "MAR" ~ "03",
      stmonthc == "APR" ~ "04",
      stmonthc == "MAY" ~ "05",
      stmonthc == "JUN" ~ "06",
      stmonthc == "JUL" ~ "07",
      stmonthc == "AUG" ~ "08",
      stmonthc == "SEP" ~ "09",
      stmonthc == "OCT" ~ "10",
      stmonthc == "NOV" ~ "11",
      stmonthc == "DEC" ~ "12",
      TRUE ~ "-"
    ),
    styear = word(AESTDAT_RAW,3),
    styear1 = if_else((styear == "UNK") | (is.na(styear)), "-", styear), ### | >> or
    aestdate = str_c(styear1, stmonth, stday, sep = "-"), ### str_c >> catx
    AESTDTC = if_else(AESTTIM != "", str_c(aestdate, str_pad(AESTTIM, width = 5, pad = "0"), sep = "T"), aestdate),
    
    AESTDTC = if_else(str_sub(AESTDTC, -5) == "-----", "", AESTDTC),
    AESTDTC = if_else(str_sub(AESTDTC, -4) == "----", str_sub(AESTDTC,end=-5), AESTDTC),
    AESTDTC = if_else(str_sub(AESTDTC, -2) == "--", str_sub(AESTDTC,end=-3), AESTDTC)
  ) %>%
  # create AEENDTC
  mutate(
    endayn = suppressWarnings(as.numeric(word(AEENDAT_RAW,1))), ### as.numeric>>input, word>>scan
    enday = if_else(!is.na(endayn), str_pad(endayn, width = 2, pad = "0"), "-"), ### is.na>>not missing, !>>not, str_pad>>put xx.
    enmonthc = str_to_upper(word(AEENDAT_RAW, 2)), ### str_to_upper>>uppercase
    enmonth = case_when(
      enmonthc == "JAN" ~ "01",
      enmonthc == "FEB" ~ "02",
      enmonthc == "MAR" ~ "03",
      enmonthc == "APR" ~ "04",
      enmonthc == "MAY" ~ "05",
      enmonthc == "JUN" ~ "06",
      enmonthc == "JUL" ~ "07",
      enmonthc == "AUG" ~ "08",
      enmonthc == "SEP" ~ "09",
      enmonthc == "OCT" ~ "10",
      enmonthc == "NOV" ~ "11",
      enmonthc == "DEC" ~ "12",
      TRUE ~ "-"
    ),
    enyear = word(AEENDAT_RAW,3),
    enyear1 = if_else((enyear == "UNK") | (is.na(enyear)), "-", enyear), ### | >> or
    aeendate = str_c(enyear1, enmonth, enday, sep = "-"), ### str_c >> catx
    AEENDTC = if_else(AEENTIM != "", str_c(aeendate, str_pad(AEENTIM, width = 5, pad = "0"), sep = "T"), aeendate),
    
    AEENDTC = if_else(str_sub(AEENDTC, -5) == "-----", "", AEENDTC),
    AEENDTC = if_else(str_sub(AEENDTC, -4) == "----", str_sub(AEENDTC,end=-5), AEENDTC),
    AEENDTC = if_else(str_sub(AEENDTC, -2) == "--", str_sub(AEENDTC,end=-3), AEENDTC)
  )


# Create AE domain vars
ae2 <- ae1 %>%
  cbind(
    STUDYID=c("PROTOCOLID"), 
    DOMAIN=c("AE"), 
    USUBJID=str_c(c("PROTOCOLID-0"),substr(ae1$SUBJECT,4,6),c("-00"),substr(ae1$SUBJECT,7,9)), # str_c() is catx() in SAS
    SUBJID=ae1$SUBJECT,
    AESPID=str_c(c("AE_001-"),ae1$RECORDPOSITION),
    AELLT=ae1$LLT_NAME,
    AELLTCD=ae1$LLT_CODE,
    AEDECOD=ae1$PT_NAME,
    AEPTCD=ae1$PT_CODE,
    AEHLT=ae1$HLT_NAME,
    AEHLTCD=ae1$HLT_CODE,
    AEHLGT=ae1$HGT_NAME,
    AEHLGTCD=ae1$HGT_CODE,
    AEBODSYS=ae1$SOC_NAME,
    AEBDSYCD=ae1$SOC_CODE,
    AESOC=ae1$SOC_NAME,
    AESOCCD=ae1$SOC_CODE,
    AESEV=ae1$AESEV_STD,
    AESER=ae1$AESER_STD,
    AEACN=ae1$AEACN_STD,
    AEREL=ae1$AEREL_STD,
    AERELNST=ae1$AEREL_WD_STD,
    AEPATT=ae1$AEPATT_STD,
    AEOUT=ae1$AEOUT_STD,
    AESCONG=ae1$AESCONG_STD,
    AESDISAB=ae1$AESDISAB_STD,
    AESDTH=ae1$AESDTH_STD,
    AESHOSP=ae1$AESHOSP_STD,
    AESLIFE=ae1$AESLIFE_STD,
    AESMIE=ae1$AESMIE_STD
  )  

# Merge AE and SDTM.DM by USUBJID, create AESTDY/AEENDY
sdtm_dm <- select(sdtm_dm,USUBJID,RFSTDTC,RFENDTC)

ae3 <- merge (ae2, sdtm_dm, by = c("USUBJID"), all.x = T) %>%
  mutate(
    aestdt=as.Date(AESTDTC),
    rfstdt=as.Date(RFSTDTC),
    rfstdate=str_sub(RFSTDTC,1,10),
    rfst_year=str_sub(RFSTDTC,1,4),
    rfst_month=str_sub(RFSTDTC,6,7),
    rfst_day=str_sub(RFSTDTC,9,10),
    AESTDY=ifelse(!is.na(aestdt) & !is.na(rfstdt),
              ifelse((aestdt>=rfstdt),aestdt-rfstdt+1,aestdt-rfstdt), ""
                  )
  ) %>%
  mutate(
    aeendt=as.Date(AEENDTC),
    rfstdt=as.Date(RFSTDTC),
    AEENDY=ifelse(!is.na(aeendt) & !is.na(rfstdt),
                  ifelse((aeendt>=rfstdt),aeendt-rfstdt+1,aeendt-rfstdt), ""
            )
  ) %>%
  # create AEENRTPT, AEENTPT
  mutate(
    AEENRTPT=ifelse(AEONGO==1,"ONGOING",""),
    AEENTPT=ifelse(AEONGO==1,
                   ifelse(is.na(rfstdt)==T,"SCREENING","END OF STUDY"),""
                  )
  )

# prepare SE dataset for creating EPOCH
sdtm_se <- select(sdtm_se,USUBJID,ETCD,SESTDTC,SEENDTC)

sest <- sdtm_se %>%
  select(USUBJID,ETCD,SESTDTC) %>%
  pivot_wider(names_from=ETCD, values_from=SESTDTC)

colnames(sest) <- c("USUBJID","st1","st2","st3")


seen <- sdtm_se %>%
  select(USUBJID,ETCD,SEENDTC) %>%
  pivot_wider(names_from=ETCD, values_from=SEENDTC)

colnames(seen) <- c("USUBJID","en1","en2","en3")

sesten <- merge (sest, seen, by = c("USUBJID"))

ae4 <- merge (ae3, sesten, by = c("USUBJID"), all.x = T)

ae5 <- ae4 %>%
  mutate(EPOCH=NA) %>%
  mutate(
    EPOCH=ifelse((st1<=aestdt & aestdt<en1) | (aestdt<=en1 & is.na(st2)==T), "SCREENING",ifelse(st2<=aestdt & aestdt<=en2, "TREATMENT", "FOLLOW-UP"))
  ) %>%
  #mutate(
  #  EPOCH=ifelse(!is.na(EPOCH)==T & !is.na(stday)==T, EPOCH, ifelse())
  #) %>%
  arrange(STUDYID,USUBJID,AEDECOD,AESTDTC,AEENDTC,AESPID) %>%
  group_by(USUBJID) %>%
  mutate(AESEQ=row_number())

# select target vars in AE
sdtm_ae <- select(ae5,STUDYID,DOMAIN,USUBJID,SUBJID,AESEQ,AESPID,
            AETERM,AELLT,AELLTCD,AEDECOD,AEPTCD,AEHLT,AEHLTCD,AEHLGT,AEHLGTCD,AEBODSYS,AEBDSYCD,AESOC,AESOCCD,
            AESEV,AESER,AEACN,AEREL,AERELNST,AEPATT,AEOUT,AESCONG,AESDISAB,AESDTH,AESHOSP,AESLIFE,AESMIE,
            EPOCH,AESTDTC,AEENDTC,AESTDY,AEENDY,AEENRTPT,AEENTPT)

# convert following vars to numeric per CDSIC definition
sdtm_ae$AELLTCD <- as.numeric(sdtm_ae$AELLTCD)
sdtm_ae$AEPTCD <- as.numeric(sdtm_ae$AEPTCD)
sdtm_ae$AEHLTCD <- as.numeric(sdtm_ae$AEHLTCD)
sdtm_ae$AEHLGTCD <- as.numeric(sdtm_ae$AEHLGTCD)
sdtm_ae$AEBDSYCD <- as.numeric(sdtm_ae$AEBDSYCD)
sdtm_ae$AESOCCD <- as.numeric(sdtm_ae$AESOCCD)
sdtm_ae$AESTDY <- as.numeric(sdtm_ae$AESTDY)
sdtm_ae$AEENDY <- as.numeric(sdtm_ae$AEENDY)

# convert NA to null
sdtm_ae$AESTDY[is.na(sdtm_ae$AESTDY)] <- ""
sdtm_ae$AEENDY[is.na(sdtm_ae$AEENDY)] <- ""

# add label
label(sdtm_ae) <- "Adverse Events"
label(sdtm_ae$STUDYID)   <- "Study Identifier"                       
label(sdtm_ae$DOMAIN)    <- "Domain Abbreviation"                    
label(sdtm_ae$USUBJID)   <- "Unique Subject Identifier"              
label(sdtm_ae$SUBJID)    <- "Subject Identifier for the Study"       
label(sdtm_ae$AESEQ)     <- "Sequence Number"                      
label(sdtm_ae$AESPID)    <- "Sponsor-Defined Identifier"             
label(sdtm_ae$AETERM)    <- "Reported Term for the Adverse Event"    
label(sdtm_ae$AELLT)     <- "Lowest Level Term"                      
label(sdtm_ae$AELLTCD)   <- "Lowest Level Term Code"                 
label(sdtm_ae$AEDECOD)   <- "Dictionary-Derived Term"                
label(sdtm_ae$AEPTCD)    <- "Preferred Term Code"                    
label(sdtm_ae$AEHLT)     <- "High Level Term"                        
label(sdtm_ae$AEHLTCD)   <- "High Level Term Code"                   
label(sdtm_ae$AEHLGT)    <- "High Level Group Term"                  
label(sdtm_ae$AEHLGTCD)  <- "High Level Group Term Code"             
label(sdtm_ae$AEBODSYS)  <- "Body System or Organ Class"             
label(sdtm_ae$AEBDSYCD)  <- "Body System or Organ Class Code"        
label(sdtm_ae$AESOC)     <- "Primary System Organ Class"             
label(sdtm_ae$AESOCCD)   <- "Primary System Organ Class Code"        
label(sdtm_ae$AESEV)     <- "Severity/Intensity"                     
label(sdtm_ae$AESER)     <- "Serious Event"                          
label(sdtm_ae$AEACN)     <- "Action Taken with Study Treatment"      
label(sdtm_ae$AEREL)     <- "Causality"                              
label(sdtm_ae$AERELNST)  <- "Relationship to Non-Study Treatment"    
label(sdtm_ae$AEPATT)    <- "Pattern of Adverse Event"               
label(sdtm_ae$AEOUT)     <- "Outcome of Adverse Event"               
label(sdtm_ae$AESCONG)   <- "Congenital Anomaly or Birth Defect"     
label(sdtm_ae$AESDISAB)  <- "Persist or Signif Disability/Incapacity"
label(sdtm_ae$AESDTH)    <- "Results in Death"                       
label(sdtm_ae$AESHOSP)   <- "Requires or Prolongs Hospitalization"   
label(sdtm_ae$AESLIFE)   <- "Is Life Threatening"                    
label(sdtm_ae$AESMIE)    <- "Other Medically Important Serious Event"
label(sdtm_ae$EPOCH)     <- "Epoch"                                 
label(sdtm_ae$AESTDTC)   <- "Start Date/Time of Adverse Event"       
label(sdtm_ae$AEENDTC)   <- "End Date/Time of Adverse Event"         
label(sdtm_ae$AESTDY)    <- "Study Day of Start of Adverse Event"    
label(sdtm_ae$AEENDY)    <- "Study Day of End of Adverse Event"      
label(sdtm_ae$AEENRTPT)  <- "End Relative to Reference Time Point"   
label(sdtm_ae$AEENTPT)   <- "End Reference Time Point"               

  
#export to xpt  
write.xport(sdtm_ae, file="C://R_software/ae_R.xpt")
# export to CSV
write.csv(sdtm_ae, file="C://R_software/ae.csv")


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/26728.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ArrayList和LinkedList的区别!!!

总结&#xff1a; 1、数据结构的实现 ArrayList&#xff1a;动态数组。 LinkedList&#xff1a;双向链表。 2、时间复杂度不同 ArrayList&#xff1a;O(1) LinkedList: O(n) ①&#xff1a;随机访问---- ArrayList > LinkedList &#xff08;ArrayList采用下标&#xff0…

ARM-V9 RME(Realm Management Extension)系统架构之调试

安全之安全(security)博客目录导读 本节中&#xff0c;“RMSD外部调试”一词用于描述任何系统或PE的外部调试功能&#xff0c;这些功能能够实现以下目的&#xff1a; 监控或修改RMSD行为。对Realm PAS或Realm安全状态的外部访问。 本节中&#xff0c;“Root外部调试”一词用于…

C++ 实现HTTP的客户端、服务端demo和HTTP三方库介绍

本文使用C模拟实现http的客户端请求和http的服务端响应功能&#xff0c;并介绍几种封装HTTP协议的三方库。 1、实现简单HTTP的服务端功能 本程序使用C tcp服务端代码模拟HTTP的服务端&#xff0c;服务端返回给客户端的消息内容按照HTTP协议的消息响应格式进行了组装。 demo如…

PC端剪映6.0免vip版本,功能随便用

下载解压后点击“JianyingPro.exe”图标即可使用&#xff0c;使用过程中无需登陆账号。操作很简单。 链接&#xff1a;https://pan.baidu.com/s/14bon1Ta9GOUFyUZDa2X3TA?pwd8h2b 提取码&#xff1a;8h2b

采用ava+B/S架构开发的工业级UWB(Ultra-Wideband)室内定系统源码UWB定位系统技术接口及技术特点

采用avaB/S架构开发的工业级UWB&#xff08;Ultra-Wideband&#xff09;室内定系统源码UWB定位系统技术接口及技术特点 UWB&#xff08;Ultra-Wideband&#xff09;定位技术本身并不直接连接蓝牙或其他无线通信技术进行定位。然而&#xff0c;在实际应用中&#xff0c;UWB定位技…

C# —— 逻辑运算符

简介 逻辑运算符用来连接多个 bool 类型表达式&#xff0c;实现多个条件的复合判断。 C#中的逻辑运算符包括&#xff1a;逻辑非( ! )、逻辑与( &&、& )、逻辑或( ||、| )。 逻辑与 & 符号 && 并且 规则: 对两个布尔值进行运算 有假则假 同真为真 bo…

怎么用住宅代理IP?使用住宅代理IP有哪些好处?

如何使用住宅代理IP&#xff1a; 使用住宅代理IP主要涉及以下几个步骤&#xff1a; 选择合适的代理IP供应商&#xff1a; 考虑供应商的可靠性、代理IP的质量、速度、稳定性以及价格。选择信誉良好且服务稳定的供应商&#xff0c;确保获得高质量的代理IP服务。配置代理IP&#…

vue面试题九

一、Vue.js如何进行性能优化&#xff1f; Vue.js 的性能优化可以从多个方面入手&#xff0c;以下是一些常见的性能优化策略和方法&#xff1a; 使用生产环境构建&#xff1a; 确保在部署生产环境之前&#xff0c;使用 Vue.js 的生产构建版本。生产构建版本会自动进行代码压缩和…

代理IP常见问题解答,新手必看手册

代理IP在互联网数据收集和业务开展中发挥着重要作用&#xff0c;它充当用户客户端和网站服务器之间的“屏障”&#xff0c;可以保护用户的真实IP地址&#xff0c;并允许用户通过不同的IP地址进行操作。然而&#xff0c;在使用代理IP的过程中&#xff0c;用户经常会遇到一些问题…

vue 中多个表单元素控一个校验规则

1. 场景一 <el-form-itemlabel"确认时长方式"prop"preSubResourceDurationDay" ><div class"confirmDurationDay">最晚使用日期前<el-input-numberv-model"form.preSubResourceDurationDay":precision"0"cla…

axure使用中继器画柱状图

源文件在顶部。 在axure通过读取中继器中的数据来画柱状图&#xff0c;如下图&#xff1a; 1&#xff09;创建一个中继器&#xff0c;在里面创建两列&#xff1a;1列是柱状图底部的名称、2列是柱的高度&#xff0c;如下图&#xff1a; 2&#xff09;双击中继器&#xff0c;画一…

ansible安装wordpress

1.回顾 yum安装wordpress 查看别名 [rootlocalhost ~]# type ll ll 是 ls -l --colorauto 的别名设置别名 aliasyum install -y alias ymyum install -y# 使用别名 ym nginx# 取消别名 unalias ym# 基于LNMP做一个wordpressnginx mysql 5.7 PHP 7.4#1、初始化过程 修改主机名…

公寓项目-验证码登录模块

文章目录 验证阿 验证阿 使用hutool工具类生成 首先要返回给前端数据 使用一个vo接收 前端接收使用的有 key 还有图片的编码 package com.healer.spzx.service.model.vo.system;import io.swagger.v3.oas.annotations.media.Schema; import lombok.Data;Data Schema(descr…

【code-server】Code-Server 安装部署

Code-Server 安装部署 1.环境准备 可以参考 https://coder.com/docs/code-server/install code-server的安装流程进行安装&#xff0c;主机环境是 Centos7 建议使用 docker 方式进行安装&#xff0c;可能会出现如下报错&#xff0c;需要升级 GNC 的版本&#xff0c;由于影响交…

派能协议,逆变器测试问题记录

问题一&#xff1a;逆变器无法进行逆变 通过抓取逆变器与bms的通讯报文&#xff0c;如下&#xff1a; 根据派能协议&#xff0c;报文标黄的对应充放电状态&#xff0c;30 30对应的数据为0 0&#xff0c;说明充放电状态全部置0&#xff0c;导致逆变器无法逆变。 问题二&#xf…

推荐系统三十六式学习笔记:原理篇.近邻推荐09|协同过滤中的相似度计算方法有哪些?

目录 相似度的本质相似度的计算方法&#xff1a;1、欧式距离2、余弦相似度3、皮尔逊相关度4 、杰卡德&#xff08;Jaccard&#xff09;相似度 总结 相似度的本质 推荐系统中&#xff0c;推荐算法分为两个门派&#xff0c;一个是机器学习派&#xff0c;一个是相似度门派。机器学…

【记录】ChatGLM3-6B大模型部署、微调(一):部署

ChatGLM3介绍 源码连接&#xff1a; ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型&#xff0c;在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上&#xff0c;ChatGLM3-6B 引入了如下特性&#xf…

算法:模拟题目练习

目录 题目一&#xff1a;替换所有的问号 题目二&#xff1a;提莫攻击 题目三&#xff1a;N字形变换 题目四&#xff1a;外观数列 题目五&#xff1a;数青蛙 首先先解释一下模拟算法是什么&#xff0c;其实模拟算法就是题目让我们干什么我们就干什么&#xff0c;思路比较简…

noVNC 小记

1. 怎么查看Ubuntu版本

汽车行驶中是怎么保障轴瓦安全的?

汽车轴瓦是一种用于减少摩擦和支撑转动部件的关键零部件&#xff0c;通常用于发动机的曲轴、凸轮轴等转动部件上。主要作用是减少转动部件之间的摩擦&#xff0c;支撑和保护曲轴、凸轮轴等旋转部件&#xff0c;确保它们在高速旋转时的稳定性和耐用性。 在汽车轴瓦加工过程中&am…