甲基化组学全流程生信分析教程

甲基化组学全流程分析和可视化教程

读取数据目录下的idat文件的甲基化全流程一键分析

功能简介

  1. 甲基化分析模块可以实现甲基化芯片450K, 870kEPIC数据的自动读取,可以读取idat文件,也可以读取beta甲基化矩阵文件
  2. 甲基化数据的缺失值插值
  3. 甲基化数据的质控分析
  4. 甲基化数据的归一化处理分析
  5. 甲基化数据的SVD分析
  6. 甲基化数据的Combat去除批次效应分析
  7. 甲基化数据的DMP差异甲基化位点分析
  8. 甲基化数据的DMR差异甲基化区域分析
  9. 甲基化数据的差异block分析
  10. 甲基化数据的GSEA分析
  11. 甲基化数据的CNA分析

参数解释

func_arraytype:可选450k或EPIC,EPIC是870K的甲基化芯片

func_resultsDir: 分析结果要保存的目录

func_compare__groups__str: 做DMP和DMR分析时候要指定的比较分组,多个分组间用;号隔开

func_runBlock:是否进行比较耗时的block分析,默认为FALSE

func_runGSEA: 是否进行比较耗时的GSEA分析,默认为FALSE

func_runCNA: 是否进行比较耗时的CNA分析,默认为FALSE

nested_function: 是否嵌套函数

run_file_path: 甲基化.idat格式的原始数据所在的目录

run_read_file:是否要读取文件

run_analysis_type_name: 分析项目名称

run_add__res__dir: 是否要创建res_dir结果目录

run_add_save_file_prefix: 是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

参数给定的默认值

func_arraytype: 450K ;

func_resultsDir: D:/omics_tools/demo_data/methylation/lung_results/ ;

func_compare__groups__str: T-C ; func_runBlock: FALSE ; func_runGSEA: FALSE ; func_runCNA: FALSE ; nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_raw/ ;

run_read_file: FALSE ; run_analysis_type_name: 10.met_analysis_from_idat ;

run_add__res__dir: FALSE ; run_add_save_file_prefix: FALSE ;

run_add__parent__dir: FALSE

窗口截图

91b02e38c0c62a26abdbc951a1658257.jpeg

运行中的显示信息

执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.met_analysis_from_idat_last_final_run_res_log.csv

运行完成的显示信息

结果展示

6f27660458d1dd399ea0cb9fb9954ee8.jpeg

读取甲基化beta矩阵文件的甲基化全流程一键分析

功能简介

  1. 甲基化分析模块可以实现甲基化芯片450K, 870kEPIC数据的自动读取,可以读取idat文件,也可以读取beta甲基化矩阵文件
  2. 甲基化数据的缺失值插值
  3. 甲基化数据的质控分析
  4. 甲基化数据的归一化处理分析
  5. 甲基化数据的SVD分析
  6. 甲基化数据的Combat去除批次效应分析
  7. 甲基化数据的DMP差异甲基化位点分析
  8. 甲基化数据的DMR差异甲基化区域分析
  9. 甲基化数据的差异block分析
  10. 甲基化数据的GSEA分析
  11. 甲基化数据的CNA分析

模块使用讲解

参数解释

func_arraytype: 可选450k或EPIC,EPIC是870K的甲基化芯片

func_met__probe__col:甲基化探针所在的列名,当从beta文件开始分析时,要提供

func_resultsDir:分析结果要保存的目录

func_sample__anno__file:样本注释信息的文件,默认是空,如果file_path给的是beta矩阵文件,则需要给出sample.anno.file

func_compare__groups__str:做DMP和DMR分析时候要指定的比较分组,多个分组间用;号隔开

func_runBlock: 是否进行比较耗时的block分析,默认为FALSE

func_runGSEA:是否进行比较耗时的GSEA分析,默认为FALSE

func_runCNA:是否进行比较耗时的CNA分析,默认为FALSE

nested_function:是否嵌套函数

run_file_path:甲基化beta矩阵的文件路径

run_read_file:是否要读取文件

run_analysis_type_name:分析项目名称

run_add__res__dir:是否要创建res_dir结果目录

run_add_save_file_prefix;是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

给定参数的默认值

func_arraytype: 450K ;

func_met__probe__col: V1 ;

func_resultsDir: D:/omics_tools/demo_data/methylation/lung_results/ ; func_sample__anno__file: D:/omics_tools/demo_data/methylation/lung_results/myImpute_pd.csv ; func_compare__groups__str: T-C ; func_runBlock: FALSE ;

func_runGSEA: FALSE ;

func_runCNA: FALSE ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myLoad_beta.csv ;

run_read_file: FALSE ;

run_analysis_type_name: 10.met_analysis_from_beta ;

run_add__res__dir: FALSE ;

run_add_save_file_prefix: FALSE ;

run_add__parent__dir: FALSE

窗口截图

021bcd2096c25d856cb502df21aee70f.jpeg

运行中的显示信息

分析正在执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation/lung_results; 运行结果日志保存的路径为: D:/omics_tools/demo_data/methylation/lung_results\10.met_analysis_from_beta_last_final_run_res_log.csv

结果展示

7cfa2ed0329789686355f0949837782a.jpeg

样本的PCA分群聚类分析和剔除异常样本

样本的PCA分群聚类分析

83267152c19dec6a2f0924948d4287f4.jpeg

34bbb9b326eeae549d12bb32da7de53d.jpeg

82a9f9f594995ac5c1db67e056d1daee.jpeg

e16d68d5d765100ad607e48d62b30077.jpeg

删除异常样本

f1da2eb257b540f130646dfec2f55597.jpeg

剔除异常样本后再次进行PCA分群聚类分析

b3d1353c995c2f6b044e79e26f304796.jpeg

cb81cd949a8032c43180296e7cab59d1.jpeg

9d77992ecadd3117e042cf197feef6da.jpeg

DMRs差异甲基化区域的基因组circos图

参数解释

func_chr__col: bed文件中染色体编号所在的列名

func_start__col: bed文件中起始位置所在的列名

func_end__col: bed文件中终止位置所在的列名

func_value__col: bed文件中结果数值所在的列名

func_use__value__threshold: 是否对value的阈值进行筛选,默认为TRUE

func_value__threshold: bed文件中结果数值的阈值,默认为0

func_p__value__col: bed文件中p值所在的列名

func_title:图表的标题

func_chr__track:是否绘制不同颜色的染色体轨道

func_species:物种的基因组版本号

nested_function:是否嵌套函数

run_file_path:甲基化DMRs结果的文件路径

run_read_file:是否要读取文件

run_analysis_type_name:分析项目名称

run_add__res__dir:是否要创建res_dir结果目录

run_add_save_file_prefix:是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

已给定参数的默认值

func_chr__col: seqnames ;

func_start__col: start ;

func_end__col: end ;

func_value__col: value ;

func_use__value__threshold: TRUE ;

func_value__threshold: 0 ;

func_p__value__col: p.value ;

func_title: DMRs genome plot ;

func_chr__track: FALSE ;

func_species: hg19 ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myDMR_BumphunterDMR.csv ; run_read_file: FALSE ;

run_analysis_type_name: 10.circlize_plot ;

run_add__res__dir: TRUE ;

run_add_save_file_prefix: TRUE ;

run_add__parent__dir: TRUE

运行中的显示信息

分析正在执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\10.circlize_plot; 运行结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.circlize_plot\10.circlize_plot_last_final_run_res_log.csv

窗口截图

8822b604a38446e6c5071b4f45a48d57.jpeg

运行完成的显示信息

执行已完成,运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\10.circlize_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.circlize_plot\10.circlize_plot_last_final_run_res_log.csv

结果展示

结果文件列表

50b2221ce447c13cce94dd3eaecf1012.jpeg

Circos图

177f1f069bc329dcb422adec31f6ea89.jpeg

差异甲基化位点结果的棒棒糖图可视化

参数解释

func_data__type:数据类型选择methylation

func_sequence__type: 序列类型,是DNA还是protein

func_gtf__anno__file: hg19的基因组注释gtf文件,450K和EPIC都是用的hg19基因组

func_gene__list__str:选择绘制的基因,多个基因用分号分割来批量绘制

func_gene__col: DMP结果文件中基因名称的列名

func_pos__col: DMP甲基化位点位置所在的列名

func_pos__name__col: 甲基化探针名称所在的列名

func_value__col: DMP结果的组间甲基化差值所在的列名

func_pval__col: DMP结果的p值所在的列名

nested_function: 是否嵌套函数

run_file_path: 甲基化DMP结果的文件路径

run_read_file: 是否要读取文件

run_analysis_type_name: 分析项目名称

run_add__res__dir: 是否要创建res_dir结果目录

run_add_save_file_prefix: 是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

已给定的参数默认值

func_data__type: methylation ;

func_sequence__type: DNA ;

func_gtf__anno__file: E:/data/download/Homo_sapiens.GRCh37.75.genome_anno.csv ; func_gene__list__str: HOXB3;CLDN18 ;

func_gene__col: gene ;

func_pos__col: MAPINFO ;

func_pos__name__col: V1 ;

func_value__col: Diff.Value ;

func_pval__col: P.Value ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myDMP_C_to_T_with_gene_anno.csv ; run_read_file: FALSE ;

run_analysis_type_name: 9.met_lollipot_plot ;

run_add__res__dir: TRUE ;

run_add_save_file_prefix: TRUE ;

run_add__parent__dir: TRUE

窗口截图

b3f2ac9ae63c6f127d913ba303072d9d.jpeg

运行中的显示信息

执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot\9.met_lollipot_plot_last_final_run_res_log.csv

运行完成的显示信息

执行已完成,运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot\9.met_lollipot_plot_last_final_run_res_log.csv

结果展示

结果文件列表

2f7eeabc9078a960528138eea9303670.jpeg

结果图

89357794e0af09a13cba113b61d84202.jpeg65d15c7badee5f38dab8dc9d861b27d3.jpeg

差异甲基化DMPs的统计分析条形图可视化

b4190a4ffe100d5925bfa45837010e46.jpeg

ed01e32dde7e5bc1c6927c9266c28390.jpeg

0019b2e20e21c9c95da1aa447fad66b5.jpeg

差异甲基化基因的火山图绘制

e90d07faaa5dedafe5e1d453ed5e774e.jpeg

12db007bccdecb80e209283832b81220.jpeg

差异甲基化基因的GO,KEGG和GSEA富集分析

差异甲基化基因的GO和KEGG富集分析

576f0b6fe540e999e7e098daf0764074.jpeg

31e57b85349124e0979b230acd10c92d.jpeg

GO富集分析结果图

04f0748758b7ff5214ac31986490cdc0.jpeg

KEGG富集分析结果图

f1c6ec295c4e753dfd2a596381e27047.jpeg

GSEA富集分析

fd04c86eb3da6f57c8761d6dc8f63861.jpeg

02f80dbcf830a24835fd742ec37ee2c5.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/52635.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python测试框架之Pytest

初识Pytest Pytest1.Pytest的特点:2.Pytest的基本使用规则3.pytest安装1)使用编译器安装2)使用命令安装 4.pytest规则 Pytest Pytest是python的一个第三方单元测试库,它的目的是让单元测试变得容易,并且也能扩展到支持…

解析云上实时数仓的挑战与实践 | Databend @DTCC 2024 演讲回顾

8 月 22 日 ~ 24 日,由 IT168 联合旗下 ITPUB、ChinaUnix 两大技术社区主办的第 15 届中国数据库技术大会(DTCC2024)在北京朗丽兹西山花园酒店成功召开。本次大会以“自研创新 数智未来”为主题,通过深度交流与探讨,推…

如何在手机上设置国内代理IP地址:详细指南

在某些情况下,我们可能需要在手机上设置国内代理IP地址,以便访问特定的网络服务或提高网络连接的稳定性。本文将详细介绍如何在Android和iOS设备上设置代理IP地址。 在Android设备上设置代理IP地址 在Android设备上设置代理IP地址非常简单,只…

MYSQL:简述对B树和B+树的认识

MySQL的索引使用B树结构。 1、B树 在说B树之前,先说说B树,B树是一个多路平衡查找树,相较于普通的二叉树,不会发生极度不平衡的状况,同时也是多路的。 B树的特点是:他会将数据也保存在非叶子节点。而这个…

C语言典型例题55

《C程序设计教程(第四版)——谭浩强》 题目: 例题4.7 兔子的繁殖。这是一个有趣的古典问题:有一对兔子,从出生后的第3个月开始起每个月都生一对兔子。小兔子长到第3个月又生一对兔子。假设所有兔子都不死,…

二叉搜索树进阶之红黑树

前言: 在上文我们已经学习了AVL树的相关知识以及涉及的四种旋转的内容,但是AVL树追求平衡导致旋转操作过多,一些情况下影响性能,由此我们就来了解一下二叉搜索树的另外一个分支,红黑树。 (倘若对旋转知识…

2024版Assimp配置教程

最近想看看图形学,选择速通LearnOpenGL,不出意外最耗时间的依然是配置环境。按照教程上的把GLFW等等配置的没有问题,但是在Assimp这里卡住了。原因是教程上说的不详细,而网上查的又和现在的版本相去甚远,导致捣鼓了好一…

从web.xml动态读取sunspringmvc.xml文件

文章目录 1.问题分析1.SunWebApplicationContext.java 中sunspringmvc.xml是写死的2.但是web.xml已经配置了init-param,所以应该是可以读取的 2.具体实现1.SunDispatcherServlet.java 得到ServletConfig传递给Spring容器完成初始化2.SunWebApplicationContext.java …

【C++从小白到大牛】C++的隐式和显示类型转换基础知识讲解

目录 1、C语言中的类型转换 2、C语言和C中可以相互转换的类型总结 C语言: CPP: 3. 为什么C需要四种类型转换 4、C四大强制类型转换 4.1static_cast 4.2 reinterpret_cast 4.3 const_cast 4.4dynamic_cast 注…

基于x86 平台opencv的图像采集和seetaface6的性别识别功能

目录 一、概述二、环境要求2.1 硬件环境2.2 软件环境三、开发流程3.1 编写测试3.2 配置资源文件3.3 验证功能一、概述 本文档是针对x86 平台opencv的图像采集和seetaface6的性别识别功能,opencv通过摄像头采集视频图像,将采集的视频图像送给seetaface6的性别识别模块从而实现…

谓词和量词

一、个体词和谓词 命题是一句陈述句,命题由个体词和谓词组成。 个体词是句子中的主语部分,比如这里的王童。 谓词是句子里的剩余部分,比如是一个三好学生 个体词用小写字母表示,谓词用大写字母+(&#…

数据库(专业存储数据)

数组、链表、变量----->内存:程序运行结束,数据丢失 文件-------------->硬盘 数据库:专业存储数据,大量数据----------->硬盘 一、数据库文件与普通文件区别: 1.普通文件对数据管理(增刪改查)效率低 2.数据库对数据…

算法: 双指针

题目:环形链表 题目讲解: 判断环 要判断链表是否有环,可以使用快慢指针的方法。快指针每次走两步,慢指针每次走一步。如果链表有环,快慢指针最终会相遇;如果没有环,快指针会先到达链表末尾。 …

MySQL:简述对事务的认识

浅谈对Spring事务的认识:https://xiaoer.blog.csdn.net/article/details/80849971 一、事务的特性 事务是数据库永恒不变的话题, ACID:原子性,一致性,隔离性,持久性。 (1)原子性&am…

基于麒麟信安操作系统的光伏发电功率预测系统完成大规模部署建设

麒麟信安操作系统,作为行业数智化建设的安全根基,为电力业务系统提供了稳定可靠的底层平台,在全球能源结构转型大潮中扮演着至关重要的角色。某光伏电站项目中,基于麒麟信安操作系统的光伏发电功率预测系统完成大规模部署建设&…

手机游玩植物大战僵尸杂交版V2.3.7最新版教程(文章末尾免费直接下载链接)

最新版植物大战僵尸杂交版V2.3.7手机游玩教程 【V2.3.7全面升级】植物大战僵尸杂交版:跨平台终极安装指南 - 苹果、安卓、电脑、电视兼容,界面革新,16卡槽扩展,高分辨率支持,BUG修复,畅享游戏乐趣 前言 …

Java Web —— 第九天(事务)

事务管理 & AOP 事务回顾 概念 事务 是一组操作的集合,它是一个不可分割的工作单位,这些操作 要么同时成功,要么同时失败 操作 开启事务(一组操作开始前,开启事务): start transaction / begin 提交事务(这组操作全部成功…

Word文档被锁定无法编辑怎么办?一键快速移除Word编辑限制

有没有遇到这种情况?打开Word文档后,准备对Word软件进行文档的编辑时,发现文档有部分内容无法进行编辑了,不知道怎么回事,其实这是因为无法编辑区域被锁定了,所以无法进行编辑,那么应该怎么解除…

Scrapy 分布式爬虫框架 Scrapy-Redis

github官网代码示例:https://github.com/rmax/scrapy-redis/blob/master/example-project/example/spiders/myspider_redis.py 什么是 Scrapy-Redis Scrapy-Redis 是一个基于 Scrapy 的扩展,用于实现分布式爬虫。它利用 Redis 作为分布式队列来共享待爬…

【Qt窗口】—— 浮动窗口

目录 1.1 浮动窗口的创建 1.2 设置停靠的位置 1.3 示例小结 在Qt中,浮动窗口也称之为铆接部件,俗称为子窗口,浮动窗口是通过QDockWidget类来实现浮动的功能。浮动窗口⼀般是位于核⼼部件的周围,可以有多个。 1.1 浮动窗口的…