孟德尔随机化——混杂SNP剔除之LDlink(1)

1、注册:LDlink | An Interactive Web Tool for Exploring Linkage Disequilibrium in Population Groups

邮箱会收到12个字符串的token,使用时需要提供token

2、包内方法

LDexpress

Determine if genomic variants are associated with gene expression.

确定基因组变异是否与基因表达相关。

LDhap

Calculates population specific haplotype frequencies of all haplotypes observed for a list of query variants.

计算查询变量列表中观察到的所有单倍型的种群特定单倍型频率。

LDmatrix

Generates a data frame of pairwise linkage disequilibrium statistics.

生成一对联动不平衡统计数据框架

LDpair

Investigates potentially correlated alleles for a pair of variants.

调查一对变异的潜在相关等位基因。

LDpop

Investigates allele frequencies and linkage disequilibrium patterns across 1000 Genomes Project populations.

在1000个基因组计划人群中调查等位基因频率和连锁不平衡模式。

LDproxy

Explore proxy and putative functional variants for a single query variant.

探索单个查询变体的代理和假定的功能变体。

LDproxy_batch

Query LDproxy using a list of query variants, one per line.

使用查询变量列表查询LDproxy,每行一个。

LDtrait

Determine if genomic variants are associated with a trait or disease.

确定基因组变异是否与性状或疾病相关。

list_chips

Provides a data frame listing the names and abbreviation codes for available commercial SNP Chip Arrays from Illumina and Affymetrix.

提供了一个数据框架,列出了来自Illumina和Affymetrix的可用商业SNP芯片阵列的名称和缩写代码。

list_gtex_tissues

Provides a data frame listing the GTEx full names, 'LDexpress' full names (without spaces) and acceptable abbreviation codes of the 54 non-diseased tissue sites collected for the GTEx Portal and used as input for the 'LDexpress' function.

提供一个数据框架,列出GTEx全称、“LDexpress”全称(不含空格)以及为GTEx Portal收集的54个非病变组织位点的可接受缩写代码,这些位点用作“LDexpress”功能的输入。

list_pop

Provides a data frame listing the available reference populations from the 1000 Genomes Project.

提供了一个数据框架,列出了1000个基因组计划中可用的参考种群。

SNPchip

Find commercial genotyping chip arrays for variants of interest.

为感兴趣的变体找到商业基因分型芯片阵列。

SNPclip

Prune a list of variants by linkage disequilibrium.

通过连锁不平衡修剪一组变异。

3、剔除混杂因素主要使用LDtrait

LDtrait(snps,#	
between 1 - 50 variants, using an rsID or chromosome coordinate (e.g. "chr7:24966446"). All input variants must match a bi-allelic variant.pop = "CEU",#人群,可以使用list_pop()查看支持人群缩写r2d = "r2",#	
use "r2" to filter desired output from a threshold based on estimated LD R2 (R squared) or "d" for LD D' (D-prime), default = "r2".r2d_threshold = 0.1,#筛选阈值,小的将被筛除win_size = 5e+05,token = NULL,#输入邮箱获得tokenfile = FALSE,genome_build = "grch37",#在三个选项中任选其一…'grch37'用于基因组构建grch37 (hg19), 'grch38'用于grch38 (hg38), 'grch38_high_coverage'用于grch38 High Coverage (hg38) 1000基因组计划数据集。默认为GRCh37 (hg19)。api_root = "https://ldlink.nih.gov/LDlinkRest"
)

4、结果展示:

 

5、解读

rs123位点与Highest math class taken (MTAG)和Educational attainment (MTAG)有关。

6、剔除原理

先检索每个位点相关的特征,满足混杂特征的位点将其剔除。

7、R函数实现

tcL<-function(snps,trait){as=LDtrait(snps=snps,pop = "ALL",r2d = "r2",r2d_threshold = 0.1,win_size = 5e+05,token = "XXXXXXXX",file = FALSE,genome_build = "grch37",api_root = "https://ldlink.nih.gov/LDlinkRest")#去除含有trait特征的SNPgwas_traits <- as[,"GWAS_Trait"]matches <-sapply(trait, function(x) grep(x, gwas_traits, ignore.case = TRUE))matches_list <- matches[lapply(matches, length) > 0] if (length(matches_list) > 0) {  ma <- unique(Reduce(union, matches_list))  } else {  # 如果没有任何匹配项,则可能返回一个空向量或 NA(取决于您的需求)  ma <- integer(0)  # 返回一个空的整数向量  } matches<-as[ma,]sn1<-unique(matches[,"Query"])snp1<-snps[!(snps %in% sn1)]return(snp1)
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/872754.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

352_C++_管理用户登录计数器的类,其中有定时器m_timer操作,定时修改【登录锁定时间】和【错误次数】

~~ 头文件 #pragma once#include "commonfunction.h" #include <boost/asio/steady_timer.hpp> #include <set> #include

第13章 更多的结构化命令《Linux命令行与Shell脚本编程大全笔记》

13.1 For命令 格式&#xff1a;for var in list;dofor命令默认按照空格、制表符、换行符作为字段分隔符区分单个值&#xff0c;如果某个值含有空格要使用双引号从命令中读取值列表for state in $(cat $file)更改字段分隔符IFS(internal field separator)IFS$\n可能的需求&…

set类和map类介绍和简单使用

目录 set类介绍与简单使用 set类 multiset类 map类介绍与简单使用 map类 multimap类 set类介绍与简单使用 set类是一种关联式容器&#xff0c;在数据检索时比序列式容器效率更高。本质是一个常规的二叉搜索树&#xff0c;但是为了防止出现单支树导致效率下降进行了相关优…

【Linux】将IDEA项目部署到云服务器上,让其成为后台进程(保姆级教学,满满的干货~~)

目录 部署项目到云服务器什么是部署一、 创建MySQL数据库二、 修改idea配置项三、 数据打包四、 部署云服务器五、开放端口号六 、 验证程序 部署项目到云服务器 什么是部署 ⼯作中涉及到的"环境" 开发环境:开发⼈员写代码⽤的机器.测试环境:测试⼈员测试程序使⽤…

SQL面试题-留存率计算

表定义&#xff1a; create table if not exists liuliang_detail (user_id string comment ,record_time string comment yyyymmdd hh:mi:ss ) comment 流量明细表 ; 方法一&#xff1a; 计算的是整段时间范围内&#xff0c;每一天为基准的所有的留存1、2、7天的用户数。 …

WEB前端05-JavaScrip基本对象

JavaScript对象 1.Function对象 函数的创建 //方法一&#xff1a;自定义函数 function 函数名([参数]) {函数体[return 表达式] }//方法二&#xff1a;匿名函数 (function([参数]) {函数体[return 表达式] }); **使用场景一&#xff1a;定义后直接调用使用(只使用一次) (fun…

GitHub每日最火火火项目(7.17)

项目名称&#xff1a;aider 项目介绍&#xff1a;aider 是一个在终端中实现 AI 结对编程的项目。它能够为开发者提供智能的编程辅助&#xff0c;帮助开发者更高效地完成编程任务。通过与 AI 的协作&#xff0c;开发者可以获得实时的代码建议、错误修复提示等&#xff0c;从而提…

成为git砖家(1): author 和 committer 的区别

大家好&#xff0c;我是白鱼。一直对 git author 和 committer 不太了解&#xff0c; 今天通过 cherry-pick 的例子搞清楚了区别。 原理 例如我克隆了著名开源项目 spdlog 的源码&#xff0c; 根据某个历史 commit A 创建了分支&#xff0c; 然后 cherry-pick 了这个 commit …

《系统架构设计师教程(第2版)》第11章-未来信息综合技术-06-云计算(Cloud Computing) 技术概述

文章目录 1. 相关概念2. 云计算的服务方式2.1 软件即服务 (SaaS)2.2 平台即服务 (PaaS)2.3 基础设施即服务 (IaaS)2.4 三种服务方式的分析2.4.1 在灵活性2.4.2 方便性方 3. 云计算的部署模式3.1 公有云3.2 社区云3.3 私有云3.4 混合云 4. 云计算的发展历程4.1 虚拟化技术4.2 分…

重塑政府服务:互联网软件与政府系统的创新融合

在数字化转型的浪潮中&#xff0c;政府服务正经历着前所未有的变革。互联网软件的快速发展为政府系统带来了前所未有的机遇&#xff0c;两者之间的创新融合正逐步重塑政府服务的面貌&#xff0c;使公共服务更加高效、便捷、个性化。 一、技术赋能&#xff0c;提升服务效率 互…

python课设——宾馆管理系统

python课设——宾馆管理系统 数据库课设-宾馆管理系统-python3.7pyqt5 简介 大二数据库课程设计&#xff08;3-4天工作量&#xff09;的项目&#xff0c;登录界面的ui设计参考了他人成果&#xff0c;其余ui以及所有后端部分全部独立完成&#xff0c;详细功能见功能模块图使用…

防火墙NAT地址转换和智能选举综合实验

一、实验拓扑 目录 一、实验拓扑 二、实验要求&#xff08;接上一个实验要求后&#xff09; 三、实验步骤 3.1办公区设备可以通过电信链路和移动链路上网(多对多的NAT&#xff0c;并且需要保留一个公网IP不能用来转换) 3.2分公司设备可以通过总公司的移动链路和电信链路访…

简单爬虫案例

准备工作&#xff1a; 1. 安装好python3 最低为3.6以上&#xff0c; 并成功运行pyhthon3 程序 2. 了解python 多进程原理 3. 了解 python HTTP 请求库 requests 的基本使用 4. 了解正则表达式的用法和python 中 re 库的基本使用 爬取目标 目标网站&#xff1a; https://…

scrapy框架爬取豆瓣top250电影排行榜(下)

&#xff08;3&#xff09;在 pipeline.py 文件中对数据进行存储&#xff0c;此程序先写 入 txt 文件中&#xff0c;是为了判断该程序是否能正确爬取出数据。 此处使用了 json 库&#xff0c;使用 ensure_ascii False&#xff0c;能够确 保非 ASCII 字符&#xff08;如中文&am…

探索Perl语言:入门学习与实战指南

文章目录 探索Perl语言&#xff1a;入门学习与实战指南一、Perl语言概述二、Perl的安装与配置安装PerlWindowsmacOSLinux 配置Perl 三、基本语法与数据类型标量变量数组哈希 四、控制结构条件语句循环语句 五、子程序与模块子程序模块 六、文件操作与正则表达式文件读取与写入正…

贪心算法(2024/7/16)

1合并区间 以数组 intervals 表示若干个区间的集合&#xff0c;其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间&#xff0c;并返回 一个不重叠的区间数组&#xff0c;该数组需恰好覆盖输入中的所有区间 。 示例 1&#xff1a; 输入&#xff1a;inter…

SpringCloud网关的实现原理与使用指南

Spring Cloud网关是一个基于Spring Cloud的微服务网关&#xff0c;它是一个独立的项目&#xff0c;可以对外提供API接口服务&#xff0c;负责请求的转发和路由。本文将介绍Spring Cloud网关的实现原理和使用指南。 一、Spring Cloud网关的实现原理 Spring Cloud网关基于Spring…

5.操作led

模版使用之前的hello驱动程序。 想要操作led&#xff0c;首先要找到原理图&#xff0c;查找GPIO对应的GPIO引脚 从图中能看出来LED2对应的GPIO是GPIO5_3&#xff0c;同时可以得知这个LED2是低电平点亮。查看cat /sys/kernel/debug/gpio可得知GPIO5_3&#xff08;第四组GPIO的第…

【Oracle】Oracle语法之递归查询

目录 递归查询使用场景备注 语法相关属性解释 案例基本使用升级版-带上递归查询的属性 总结&#xff1a; 递归查询 Oracle的递归查询是指在一个查询语句中使用自引用的方式进行循环迭代查询。它可以用于处理具有层次结构的数据&#xff0c;如组织架构、产品类别等。递归查询通…

【深度学习入门篇 ⑧】关于卷积神经网络

【&#x1f34a;易编橙&#xff1a;一个帮助编程小伙伴少走弯路的终身成长社群&#x1f34a;】 大家好&#xff0c;我是小森( &#xfe61;ˆoˆ&#xfe61; ) &#xff01; 易编橙终身成长社群创始团队嘉宾&#xff0c;橙似锦计划领衔成员、阿里云专家博主、腾讯云内容共创官…