GWAS 分析模型 | FaST-LMM

GWAS 分析模型 | FaST-LMM

FaST-LMM (Factored Spectrally Transformed Linear Mixed Models) 是一个用于进行全基因组关联分析(GWAS)的模型。与标准混合线性模型相比,FaST-LMM 通过对遗传相似性矩阵进行单次谱分解来减少计算资源消耗并提升运行速度,因此特别适用于超大型数据集的 GWAS 分析。

alt

扫码关注微信公众号【生信F3】获取更多生物信息学最新知识。

ShengXinF3_QRcode
ShengXinF3_QRcode

安装

FaST-LMM 提供了供直接运行的预编译版本(FastLmmC v2.07.20140723),下载后即可使用:

https://www.microsoft.com/en-us/download/details.aspx?id=52588

./fastlmmc

用法

FaST-LMM 需要四个输入文件(ASCII 编码),包含

  1. SNP 数据
  2. 用于计算个体间遗传相似性(亲缘关系矩阵)的 SNP 数据(可以与1不同)
  3. 表型数据
  4. 一组协变量(可选)

仅计算遗传相似性矩阵:

./fastlmmc -runGwasType NORUN \
 -pheno Trait1.plink.txt -missingPhenotype NA \
 -fileSim test \
 -simOut test.sim

-runGwasType

计算遗传相似矩阵的谱分解后,运行 GWAS 或退出。使用 NORUN,缓存谱分解。默认值:RUN。

运行 GWAS:

./fastlmmc
-tfile test
-pheno Trait1.plink.txt
-tfileSim test
-simOut out.sim
-out test_fastlmm.out.txt
-missingPhenotype NA -maxChromosomeValue 1000000 -maxThreads 5

常用选项

1. 基因型

输入文件 SNP 数据应该为 PLINK 格式(ped/map, tped/tfam, bed/bim/fam, or fam/dat/map)。使用依赖 SNP 排序的二进制格式可以获得最快的速度。这些文件中的表型条目必须被设置为虚值并将被忽略(FaST-LMM 软件使用单独的表型文件)。性别应该被编码为一个数字。缺失的 SNP 值将被按均值填补。

注意:该软件只能接受整数或字符串形式(X、Y、XY 或 MT)的染色体编号,因此对于非模式物种,建议在 SNP 标识符中包含染色体 ID,并将染色体 ID 列全部以数字 0 填充。

-file basefilename

.map.ped 格式的文件基名

-bfile basefilename

​ 二进制 .bed, .fam.bin 格式的文件基名

-tfile basefilename

​ 转置后 .tfam.tped 格式的文件基名

2. 亲缘关系

-tfileSim basefilename

​ 用于构建遗传相似度(亲缘关系)的转置后 .tfam.tped 格式的文件基名(可与基因型数据保持一致)

-simOut filename

​ 指定将遗传相似度写入此文件

3. 表型

-pheno filename 表型文件名

-missingPhenotype

缺失值的标识符。如果一个个体的表型缺失,那么该个体就会被忽略。如果一个个体的协变量值缺失,则以平均值估算。默认值为 -9。

包含表型数据的文件使用 PLINK 的表型格式。其至少包含三列:familyID、individualID 和任意数量的表型值。列间以制表符或空格分隔。默认仅测试第一列表型值,缺失值默认以 -9 表示,但一般建议以 -missingPhenotype 选项来指定缺失值。第一列 familyID 与第二列 individualID 相连接从而为个体创建唯一的标识符,并与上述 PLINK 文件中的个体条目相匹配。例如:

cid0P0 cid0P0 0.4853395139922632
cid1P0 cid1P0 -0.2076984565752155
cid2P0 cid2P0 1.4909084058931985
cid3P0 cid3P0 -1.2128996652683697
cid4P0 cid4P0 0.4293203431508744
4. 其它

-maxThreads <int>

该选项被传递给 MKL 数学库(Intel)以 "建议" 使用的并行程度。指定一个大于计算机上核心数的数字可能会导致程序运行得更慢。指定一个小于核心数的数字可能会使计算机在运行 FastLmmC 时不会在程序的不同阶段消耗所有的 CPU 资源。在使用 ACML 数学库(AMD)时,MaxThreads 选项将被忽略

-covar filename

包含协变量的可选文件

结果输出

-out filename

输出文件的名称。默认值是 [basefilename].out.txt。如果使用扩展名是 .csv,输出文件将以逗号分隔。否则将以制表符分隔。

默认输出文件如下所示:

alt

每列含义如下:

  1. SNP:SNP 标识符。
  2. Chromosome:SNP 的染色体标识符,取自 PLINK 文件。
  3. Genetic Distance:SNP 的遗传距离,未知则为 0。
  4. Position:SNP 的物理位置。
  5. Pvalue:计算所得 P 值。
  6. Qvalue:使用 Benjamini-Hochberg 校正 p 值后所得的 q 值
  7. N:用于分析的个体数量
  8. NullLogLike
  9. AltLogLike
  10. SNPWeight
  11. SNPWeightSE
  12. OddsRatio
  13. WaldStat
  14. NullLogDelta
  15. NullGeneticVar
  16. NullResidualVar
  17. NullBias

扫码关注微信公众号【生信F3】获取更多生物信息学最新知识。

ShengXinF3_QRcode
ShengXinF3_QRcode

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/174305.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

超全超实用行业解决方案合集,覆盖十大行业数据应用需求

现代企业面对复杂的业务需求&#xff0c;对数据分析的需求日益增加。 从实时销售到市场趋势&#xff0c;从客户行为到产品优化&#xff0c;每个环节都依赖于数据支持。然而&#xff0c;传统的数据分析平台常分散在不同系统和团队中&#xff0c;形成数据孤岛&#xff0c;降低了…

企业如何保障跨境金融业务中的数据安全传输?

随着全球化的不断深入&#xff0c;跨境金融业务日益频繁&#xff0c;然而在这些业务中&#xff0c;数据的安全传输一直是企业面临的重大挑战。跨境业务数据传输可能会遇到多种困难&#xff0c;如网络攻击、数据泄露、通信故障等。因此&#xff0c;企业需要采取有效的措施来确保…

C#,《小白学程序》第二十二课:大数的乘法(BigInteger Multiply)

1 文本格式 using System; using System.Linq; using System.Text; using System.Collections.Generic; /// <summary> /// 大数的&#xff08;加减乘除&#xff09;四则运算、阶乘运算 /// 乘法计算包括小学生算法、Karatsuba和Toom-Cook3算法 /// </summary> p…

漏洞复现--致远 M3 反序列化 mobile_portal RCE

免责声明&#xff1a; 文章中涉及的漏洞均已修复&#xff0c;敏感信息均已做打码处理&#xff0c;文章仅做经验分享用途&#xff0c;切勿当真&#xff0c;未授权的攻击属于非法行为&#xff01;文章中敏感信息均已做多层打马处理。传播、利用本文章所提供的信息而造成的任何直…

AIGC系列之:DDPM原理解读(简单易懂版)

目录 DDPM基本原理 DDPM中的Unet模块 Unet模块介绍 Unet流程示意图 DownBlock和UpBlock MiddleBlock 文生图模型的一般公式 总结 本文部分内容参考文章&#xff1a;https://juejin.cn/post/7251391372394053691&#xff0c;https://zhuanlan.zhihu.com/p/563661713&…

03 项目运行

前面两篇文章对项目架构+源码架构做了分析,这篇文章先将服务部署一下,能够让大家有个直观的感受。 组件资源 项目运行的各种组件已经为你准备好了,有需要的直接百度云盘下载: 链接:https://pan.baidu.com/s/1hN6qf20gamMHPmA_qXwsLg提取码:o4k9MySQL数据库创建 找到的…

2023年最新Dev-C++下载安装以及C语言环境搭建教程(C语言入门)

文章目录 写在前面C语言简介Dev-C简介Dev-C下载安装Dev-C使用教程 写在后面 写在前面 2023年最新Dev-C下载安装以及C语言环境搭建教程&#xff0c;快来看看吧&#xff01; C语言简介 C语言是一种通用的高级程序设计语言&#xff0c;由美国计算机科学家Dennis Ritchie于20世纪…

51单片机的智能窗帘系统【含proteus仿真+程序+报告+原理图】

1、主要功能 该系统由AT89C51单片机LCD1602显示模块DS18B20温度模块DS1302时间模块光敏传感器步进电机蓝牙等模块构成。适用于智能窗帘、智能门窗家具等相似项目。 可实现基本功能: 版本一&#xff1a; 1、LCD1602实时显示北京时间、环境温度、光照强度、手动/自动控制等信息…

什么是磁矩?磁矩与磁通的关系

物质的磁性来源于原子中的电子磁矩 物质由原子构成&#xff0c;而原子是由原子核和电子组成的。在原子中&#xff0c;电子因绕原子核运动而具有轨道磁矩&#xff1b;电子因自旋具有自旋磁矩&#xff0c;原子的磁矩主要来源于电子磁矩&#xff0c;这是一切物质磁性的来源。 磁…

Golang 设置运行的cpu数与channel管道

介绍&#xff1a;为了充分了利用多cpu的优势&#xff0c;在Golang程序中&#xff0c;设置运行的cpu数目。 func main() {//获取系统当前cpu的数量num : runtime.NumCPU()//这里根据需求来设置整个go程序去使用几个cpuruntime.GOMAXPROCS(num)fmt.Println("num ", nu…

kafka集群环境部署

文章目录 1 Kafka集群2 搭建两台服务器2.1 zookeeper部署2.2 启动1号机器的broker2.3 启动2号机器的broker2.4 查看kafka集群2.5 测试集群 1 Kafka集群 2 搭建两台服务器 2.1 zookeeper部署 zookeeper先只部署一台&#xff0c;在1号机器&#xff08;192.168.11.59&#xff09;…

图解系列--Http

1.URI和URL 1.1.URL URL是统一资源定位符。URL正是使用 Web 浏览器等访问 Web 页面时需要输入的网页地址。比如&#xff0c;http://hackr.jp/就是 URL。 1.2.URI 统一资源标识符。 URI 用字符串标识某一互联网资源&#xff0c;而URL表示资源的地点&#xff08;互联网上所处的位…

C语言标准

1、概述 C语言标准是由ANSI&#xff08;美国国家标准协会&#xff09;和ISO&#xff08;国际标准化组织&#xff09;共同制定的一种语言规范。标准经历过如下更新&#xff1a; C89/C90标准C99标准C11标准C17标准 2、C89/C90标准 (1)这是1989年正式发布的C语言标准&#xff0…

成都爱尔樊映川院长讲解常见眼底病有哪些

一提到“眼底”这个眼科常用词汇&#xff0c;许多非医疗行业人士认为在眼球下方&#xff0c;其实不然&#xff0c;那眼底在哪呢?眼底其实是眼球内后部的组织&#xff0c;即眼球的内膜——视网膜、视乳头、黄斑和视网膜中央动静脉。 眼底病是一种病种繁多&#xff0c;病因复杂&…

C++学习之路(五)C++ 实现简单的文件管理系统命令行应用 - 示例代码拆分讲解

简单的文件管理系统示例介绍: 这个文件管理系统示例是一个简单的命令行程序&#xff0c;允许用户进行文件的创建、读取、追加内容和删除操作。这个示例涉及了一些基本的文件操作和用户交互。 功能概述&#xff1a; 创建文件 (createFile())&#xff1a; 用户可以输入文件名和内…

Hiera实战:使用Hiera实现图像分类任务(一)

文章目录 摘要安装包安装timm 数据增强Cutout和MixupEMA项目结构计算mean和std生成数据集_pickle.PicklingError: Cant pickle <function Head.<lambda> at 0x000001DE8DD7F240>: attribute lookup Head.<lambda> on hiera.hiera failed 摘要 现代层次视觉变…

Vue组件的几种通信方式

这里写目录标题 Vue组件的几种通信&#xff08;数据传递&#xff09;方式非父子组件间通信&#xff08;Bus事件总线&#xff09;介绍实例 非父子通信-provide&inject1.作用2.场景3.语法4.注意 父子组件间的通信固定props属性名&#xff08;v-model&#xff09;介绍实例 不固…

vue页面表单提交时如何做校验

我们在做新增的时候&#xff0c;新增对话框是要加必填校验的&#xff0c;否则就可能会加空数据或者会产生sql的报错。那么这个校验是如何加的呢&#xff1f;下面我们来说一下。 文章目录 一、必填校验1.1 给form表单绑定一个:rules校验规则&#xff0c;给每个item加上一个prop…

api自动化测试

API测试已成为日常的测试任务之一&#xff0c;为了提高测试效率&#xff0c;减少重复的手工操作&#xff0c;API自动化测试也逐渐变得愈加重要&#xff0c;本文是自己在API自动化测试方面的一些经验积累和心得、汇总成文&#xff0c;以飨读者 我相信自动化技能已经成为高级测试…

5. 链表

内存空间是所有程序的公共资源&#xff0c;在一个复杂的系统运行环境下&#xff0c;空闲的内存空间可能散落在内存各处。我们知道&#xff0c;存储数组的内存空间必须是连续的&#xff0c;而当数组非常大时&#xff0c;内存可能无法提供如此大的连续空间。此时链表的灵活性优势…