在全基因组关联分析中,处理芯片数据时,必须走的一个流程就是基因型数据填充(imputation)。
当然,如果你拿到的是全测序的数据,请忽略这一步。
下面直奔主题,怎么在网页版进行基因型填充。
1 进入Michigan Imputation Server
Michigan Imputation Server网站链接:https://imputationserver.sph.umich.edu/index.html#!pages/home
进入该网站,进行注册。
注册完以后,接下来准备imputation需要的输入文件
2 准备imputation需要的输入文件
Michigan Imputation Server网站只接受压缩包的vcf格式(vcf.gz),故需要先将手头上的文件转化为vcf.gz格式
2.1 转化ped/map为vcf格式文件
plink --ped mystudy_chr1.ped --map mystudy_chr1.map --recode vcf --out mystudy_chr1
2.2 将vcf格式文件压缩为vcf.gz格式
这一步骤需要安装VCFtools和tabix两个工具
安装成功后,使用如下命令:
vcf-sort mystudy_chr1.vcf | bgzip -c > mystudy_chr1.vcf.gz
3 上传数据
以下两种方式任选一种。
3.1 上传vcf.gz文件的方式
具体使用操作见下图: