易基因:【表观遗传学基础】如何研究DNA甲基化

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

表观遗传学近几年取得的一系列研究进展,确实吸引着越来越多的关注!为了帮大伙儿梳理一下表观遗传学的基本概念和研究方法,小编打算开一个系列专题,详细聊一聊这里面的弯弯绕!

​话说,关于表观遗传学,小编被问得最多的问题,就是应该如何研究DNA甲基化,哪些技术适合我使用?

每次,小编都会耐心地把各种技术的优势解释一遍。说的多了,发现说来说去就是几个核心点,干脆列出来,跟大伙儿分享一下:

  • 1.在表观遗传修饰中存在哪些甲基化修饰?

  • 2.DNA甲基化起到的作用是什么?

  • 3.现在研究DNA甲基化的技术手段有哪些?各有什么优势和劣势?

  • 4.常规的分析方法及内容有哪些?

1、什么是甲基化修饰?

首先说一下第一个问题,存在哪些甲基化修饰

现在对于甲基化修饰的研究,总的来说大致可以分为三大类:

  • DNA甲基化修饰,这一类是研究最多,修饰也最为稳定的类型;

  • 组蛋白甲基化修饰,以及乙酰化(如果大伙儿对这块也感兴趣,小编下次可以开一个专题来单独讲了,这里就不啰嗦了);

  • RNA甲基化修饰,虽然RNA的修饰有100多种,但A碱基甲基化修饰(6mA)研究最为成熟和火爆,后续系列小编会慢慢讲。

今天我们重点聊一聊DNA的甲基化修饰。

那么,什么是DNA甲基化修饰呢?简单的讲,就是在DNA上胞嘧啶发生了一个甲基基团的修饰,有图有真相:

因此,提到DNA甲基化的时候,我们也会说5mC甲基化。别看这只是一个小小的改变,它所起到的作用却是巨大的!有些科学家甚至将DNA甲基化叫做“第五种碱基”!

2、DNA甲基化的作用

那么第二个问题就来了,这玩意儿有什么作用呢?

简单来说,DNA甲基化可以调控基因的表达。以高等动物为例,每个个体从一个受精卵发育成成体的过程中,DNA甲基化都是不同的,会调控不同的细胞往不同的方向分化。比如,哪些细胞群变成大脑,哪些变成心脏,都和它有着密切的关系。

另外一个方面,当我们长大了,如果某些关键基因的DNA甲基化发生了改变,那就坏掉了,很可能会引起癌症,糖尿病等多种疾病。

在人以及各种哺乳动物中,很多C和G连续的碱基上会发生DNA甲基化,而与C相邻的其他碱基则不会,这种现象与DNA甲基化修饰酶有一定的关系。

在人的基因组上,有很多CG碱基聚集的地方,我们称之为CpG岛,这个地方往往是低甲基化的,如果甲基化发生了改变,就会导致后面的基因无法表达,进而就会有一系列问题了。所以在大量的文献中,CpG岛的甲基化修饰一直是研究重点。

现在又有了CpG 海岸的概念。啥意思呢?就是科学家们发现,除了CpG岛会出问题,岛旁边的位置也很容易发生改变!

在很多研究中,大家都会关心DNA甲基化是不是导致基因表达变化了,而很多转录起始位置附近也会有CpG岛,所以我们也常常会把研究的焦点集中于转录起始位置的启动子区域(一般是转录起始位置上游2k,下游500的样子,当然不同研究中的定义略有不同)。

除了发现DNA甲基化会调控基因表达,也有发现表明,外显子和内含子的DNA甲基化异常也会导致不同的选择性剪切,这个也是一个重要的研究内容。

3、研究方法与技术手段

上面说了DNA甲基化的作用,接下来聊聊第三个问题:研究DNA甲基化的技术手段有哪些咧?

简单的说,可以分为两大类。

一类是IP类的,代表作就是DNA甲基化免疫共沉淀技术(MeDIP-seq),当然还有专门富集CpG的MBD技术,不过研究的不多。

另外一类就是今天要说的重点内容:重亚硫酸盐处理技术。它包括的种类五花八门,比如:

  • 全基因组DNA甲基化技术(WGBS)

  • 酶切简化基因组甲基化技术(RRBS/DRRBS)

  • 启动子液相捕获DNA甲基化测序技术(LHC-BS)

  • 基于氧化的精确DNA甲基化技术(oxBS)

DRRBS技术和LHC-BS是小编自己研发的,这种技术的优势在于,想研究哪里就捕获哪里,具体的实现我们后面详细的聊。

另外,这里要重点说一下精确DNA甲基化技术。什么是精确?比如,在动物体内,DNA甲基化是一个动态变化的过程,不仅有DNA甲基化过程,也有TET酶参与的去甲基化过程。在去甲基化的过程中,甲基基团首先会被氧化成羟基,这个羟基在后续会进一步被氧化成醛基、羧基,然后就变成无官一身轻的胞嘧啶了。

图:胞嘧啶氧化过程

重亚硫酸酸盐处理以后,醛基修饰的胞嘧啶,羧基修饰的C,还有没有甲基化的C全部都会变成胸腺嘧啶T。传统的bisulfite技术研究的是甲基化和羟甲基化,而精确DNA甲基化技术是通过氧化剂,把羟基给氧化了,这样后续处理的时候,也会变成T,而剩下的就只有甲基化胞嘧啶C了。所以通过这个技术,可以将羟甲基化单独拎出来研究。目前,国内成熟的氧化甲基化技术(oxBS)由易基因独家推出。

说完了技术手段,接下来我们讨论一下各种技术的优劣势。

先说准确性。现在研究DNA甲基化,最准确的自然还是重亚硫酸盐处理,这种手段可以精确的看到每个胞嘧啶位点上的甲基化修饰情况。对于经费充足的实验室,重亚硫酸盐处理技术中的WGBS技术是首选,此技术可以覆盖全基因组,一般要求30X,比如人的基因组差不多需要90G的数据量。考虑到测序成本,此技术更适合经费充足的实验室,或者做植物研究的实验室。

对于精度要求更高的,比如只研究精确的DNA甲基化的修饰情况,或者是想研究羟甲基化的修饰情况,oxWGBS是首选,它的成本也相对比较高。此类技术的应用限制,现阶段来说就是测序成本较高。

其他定量研究DNA甲基化的技术,都是只研究基因组上一部分区域的甲基化修饰情况,代表技术有RRBS(基于酶切),LHC-BS(基于液相捕获),以及现在临床应用比较多的850k/450k甲基化芯片。

RRBS和LHC-BS是基于测序技术,研究的CpG位点数大概都是在2M左右,也是基于测序技术研究大规模样品常用的工具之一,数据量一般8-10G。

RRBS研究的区域是全基因组上的酶切位点,如MspI酶的CCGG位点等。不过此类技术在现有读长PE150的背景下会浪费很多数据(因为有效的酶切区域片段为40-220,现有测序技术会被测通,从而导致大量数据被浪费)。

而LHC-BS的优势在于可以覆盖基因组上绝大多数的启动子区域(95%),全部的CG岛和CpGshore区域,但是对实验操作者的水平要求较高。此条件下,8G的数据量,在人的样品中目标区域60M,可得到的实际深度为50~60X,和BS技术对比吻合度也比较好,对现阶段大规模DNA甲基化样品研究而言,还是一个值得选择的工具了。

再有就是450k甲基化芯片和850k甲基化芯片,这两款芯片是基于荧光定量来鉴定DNA甲基化的,和测序的结果吻合度也较好,但问题在于检测位点数太少,且现阶段的成本也不便宜,与RRBS和LHC-BS相比成本也低不了太多。

说了这么多,大伙儿是不是有点晕?来,我们整个图,直观地展示一下这几种技术在各基因元件上的覆盖情况。

4、DNA甲基化的数据分析

小编是生信背景,数据分析是本人的老本行。下面我们就详细聊聊第四点,DNA甲基化数据分析的常规流程及工具。

针对DNA甲基化的数据分析,基本上是三步走(大家看到的各个公司提供的分析报告也基本如此)。

首先是质控。此步骤通常是过滤低质量的reads,一般测序结果为N占总reads数50%,或者低质量base数占总base数的50%会过滤掉。如果测序数据比较充足可以不用管这个部分的参数设置。

过滤完毕后,下一步就是比对了。这个部分是很消耗资源的。一般用的研究DNA甲基化的高通量测序软件主要有BSMAP、BS Seeker、bismark、SOCS-B、BRAT等,网上有人总结过这些软件,感兴趣的小伙伴可以自行查找一下。

小编个人比较推荐BSMAP,计算速度快,操作简单,自带的脚本也可以比较方便的计算出C位点的甲基化率(CG/CHG/CHH)。

第三步,也是比较重要的一步,就是找DMR或者DMS。常见的软件有MethMarker、metilene、eDMR等。上面这两款软件对于找DMR还是不错的,当然也可以自己写脚本来验证。

另外在高级分析方面,DNA甲基化的分析也可以结合SNP的结果。这方面的软件有BS-SNPer、bis-SNP等,各有优势,有的是基于GATK流程开发的,有的是基于SOAPSNP开发的,在速度和准确性方面各有千秋。

其他的分析如ASM,推荐amrfinder软件,这款软件现在整合到了methpipe中,感兴趣的小伙伴们都可以试试。另外对于如MeDIP类的技术,一般也是先过滤低质量reads,然后再比对,call peak。不过这里小编建议对于两组peak间最好求出组间的差异,对于后续分析还是蛮有用的。

这些流程走完了之后,后面基本上都是一些功能分析的内容了,可以根据各自不同的项目分别选用不同的工具,这里就不啰嗦了。

能读到这里的小伙伴,也是真爱了!本文只是对各个技术做了简单的总结,后面会针对每个技术展开来,做详细的介绍和讨论,大伙儿如果喜欢可以继续关注。

感兴趣的小伙伴们,可以留言点赞,赠送于文强、徐国良老师主编的【表观遗传学】书籍上下册,(文件有点大)目录如下:

感兴趣的小伙伴们,可以留言点赞,免费赠送于文强、徐国良老师主编的【表观遗传学】书籍上下册(文件有点大),可私信。

DNA甲基化干货分享:

干货系列:DNA甲基化研究的3大前期探索性实验思路

干货分享:DNA甲基化研究的测序数据挖掘思路

干货分享:DNA甲基化差异水平分析中的DMC、DMR、DMG鉴定

干货分享:DNA甲基化测序后的后期验证方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/26599.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VBA实现关闭Excel自动计算,关闭屏幕刷新

Excel代码提速神器 涉及到提取表格大量数据操作,复制粘贴多个单元格时,尽量避免一个个单元格提取,或者一行行一列列提取数值,设计大量IO流操作非常浪费时间。尽量找出数据之间的规律,批量选中复制粘贴,找到…

第五十一天 | 1143.最长公共子序列

题目:1143.最长公共子序列718.最长重复子数组的区别是,子序列不要求连续,子数组要求连续。这一差异体现在dp数组含义和递推公式中,本题是子序列,那就要考虑上nums1[i - 1] ! nums2[j - 1]的情况。 本道题与 1.dp数组…

2024年你需要了解的仅有的10种防检测浏览器

在不断发展的互联网隐私和安全领域,要保持领先地位就必须使用最先进的工具和方法,包括VPN、密码管理器、防病毒软件、防火墙、广告拦截器等。在这些安全措施中,反侦测浏览器占有独特的地位,因为它们通过掩盖用户的数字足迹来增强网…

inBuilder 低代码平台新特性推荐 - 第二十一期

今天给大家带来的是inBuilder低代码平台新特性推荐第二十一期——inBuilder单点登录链接生成器 一、场景介绍 在系统间的集成对接过程中,普遍存在通过单点登录链接进入系统的场景。比如通过单点登录链接进入流程工作台,进入用户管理等功能。inBuilder单…

单点登录分析介绍

文章目录 1、单点登录解决方案1.1、后端保存登录状态1.2、token模式 2、user服务-登录接口2.1、UserController2.2、UserInfoServiceImpl2.3、载荷2.4、响应2.5、Redis Desktop Manager 1、单点登录解决方案 多个系统只有一个登录服务 1.1、后端保存登录状态 1.2、token模式 …

pdf书签怎么做?这三款软件轻松驾驭文档!

在数字化时代,PDF文件已成为我们工作、学习中的重要组成部分。然而,面对海量的PDF内容,如何快速定位关键信息,提高阅读效率呢?答案就是——制作PDF书签。今天,我将为大家介绍三款实用的软件,助你…

LangChain 与 Elastic 合作为 RAG 添加向量数据库和语义重排序

作者:来自 Elastic Max Jakob 在过去的一年中,我们看到了生成式人工智能领域的许多进展。许多新服务和库应运而生。LangChain 已成为使用大型语言模型 (LLM) 构建应用程序的最受欢迎的库,例如检索增强生成 (RAG) 系统。该库使原型设计和试验不…

大数据学习——安装hive

一. 安装准备 1. 打开虚拟机,启动配置了NameNode节点的虚拟机(一般和mysql在同一台虚拟机)并连接shell 二. 安装 1. 上传hive安装包 hive安装包 提取码:6666 切换到/opt/install_packages目录下 可以将之前解压的rpm文件删除…

C语言调用so/dll动态库

文章目录 windows系统linux系统windows 与 linux下 C 调用动态库的差异 C语言调用动态链接库 windows系统 windows系统下&#xff0c;C语言调用win下的动态库dll&#xff0c;使用头文件<windows.h>。 准备基础C代码 lauf.c #include <stdio.h>// 定义函数&#x…

算法课程笔记——线段树维护矩阵

算法课程笔记——线段树维护矩阵 2

前后端知识点汇总

springboot项目启动 springboot集成naocs和redis springboot集成mybatis springboot集成mybatisPlus 集成rabbitMq 集成sa-token satoken介绍 sa-token官网Sa-Token 是一个轻量级 Java 权限认证框架,主要解决:登录认证、权限认证、单点登录、OAuth2.0、分布式Session会…

【stm32】基于I2C协议的OLED显示(利用U82G库)

【stm32】基于I2C协议的OLED显示&#xff08;利用U82G库&#xff09; 一、实验目的二、探究任务三、原理探究3.1 I2C接口3.1.1 概述3.1.2 主要特点3.1.3 功能描述3.1.4 从模式3.1.5 主模式3.1.6 时序协议 3.2 OLED屏3.2.1 工作原理3.2.2 汉字点阵显示原理3.2.3 汉字点阵取模 四…

【后端开发】服务开发场景之高性能(CDN与负载均衡,数据库优化,消息队列)

【后端开发】服务开发场景之高性能&#xff08;CDN与负载均衡&#xff0c;数据库优化&#xff0c;消息队列&#xff09; 文章目录 1、内容分发网络&#xff08;CDN &#xff09; & 负载均衡算法CDN是什么&#xff1f;&#xff08;静态资源加速&#xff09;CDN的应用场景&am…

OV5647与树莓派bullseye 64bit的兼容性问题

OV5647与树莓派bullseye 64bit的兼容性问题 1. 源由2. 问题3. 分析方法一&#xff1a;使用 pyudev 库方法二&#xff1a;使用 v4l2-ctl 工具方法三&#xff1a;直接读取 /dev 目录方法四&#xff1a;使用 OpenCV方法五&#xff1a;使用 Picamera方法六&#xff1a;使用 libcame…

『原型资源』Axure自带图标库不够用,第三方经典图标库来袭

​今天小编为大家带来第三方经典图标库&#xff0c;己确认内容可用现推荐给大家。直接上手就可不用自己画哈~ 获取原型文档请与班主任联系&#xff01; 先睹为快&#xff0c;合适再拿走不谢&#xff1a; 图标太多&#xff0c;截取部分给大家参考o(*&#xffe3;︶&#xffe3;*…

Java最新面试题(全网最全、最细、附答案)

一、Java基础 1、基础概念与常识Java 语言有哪些特点? 简单易学&#xff08;语法简单&#xff0c;上手容易&#xff09;&#xff1b;面向对象&#xff08;封装&#xff0c;继承&#xff0c;多态&#xff09;&#xff1b;平台无关性&#xff08; Java 虚拟机实现平台无关性&a…

OCP学习笔记-007 SQL语言之二:DML

2. DML - Data Manipulation Language 数据操纵语句,用于添加、删除、更新和查询数据库记录,并检查数据完整性,常用的语句关键字主要包括insert、delete、udpate和select等。(增添改查) 事务:A transaction consists of a collection of DML statements that form a logi…

Vue 3获取DOM元素的大小以及相对于视口的位置的getBoundingClientRect属性

在Vue 3中&#xff0c;可以使用ref来获取DOM元素的getBoundingClientRect属性。 如果元素已挂载&#xff0c;我们使用 getBoundingClientRect 方法来获取元素的位置和大小信息。这个方法返回一个对象&#xff0c;其中包含了 left、top、right、bottom 等属性&#xff0c;这些属…

LVS负载均衡集群企业级应用实战-LVS/NAT模式(三)

目录 LVS/NAT模式 一. 环境准备 二. 对虚拟服务器操作 三. 对真实服务器操作 四. 打开网站验证 LVS/NAT模式 一. 环境准备 主机名主机IP模拟服务器系统用途localhost 10.36.178.156 192.168.226.137 虚拟服务器 Rocky_linux 客户兼负载均衡机分发IPlocalhost192.168.226…

关于Linux桌面系统的普及 这里是一些建议

Linux 桌面系统在普及方面面临一些挑战&#xff0c;尽管它在服务器和开发者社区中非常受欢迎。为了提高其普及率&#xff0c;可以从以下几个方面着手&#xff1a; 1. 改善用户体验 用户界面友好性&#xff1a;提升桌面环境的易用性和美观度&#xff0c;使其更符合普通用户的习…