GCE的安装和使用

GCE的安装和使用

  • GCE的安装使用
    • 1. GCE的安装
    • 2. GCE的使用
    • 补充:一个简单的R脚本——kmerpdf.R,用于绘制kmer的种类和数量分布图

GCE的安装使用

一个基因组评估软件。其他同类型软件Genomescope

1. GCE的安装

Github官网:https://github.com/fanagislab/GCE
点击Code,点击Download ZIP,下载文件GCE-master.zip
在这里插入图片描述cd /home/zhaohuiyao/Biosoft
#上传文件GCE-master.zip
unzip GCE-master.zip
cd GCE-master/
make
#安装成功
#可执行文件位置:/home/zhaohuiyao/Biosoft/GCE-master/gce-1.0.2/gce

2. GCE的使用

准备好过滤后的二代cleandata

cd /home/zhaohuiyao/Genome_survey/03kmer
#创建cleandata.txt文件
在这里插入图片描述
#初步设定kmer=17mer(常用)
#kmer频率统计
/home/zhaohuiyao/Biosoft/GCE-master/gce-1.0.2/kmerfreq -k 17 -t 18 -p 17mer_shuxi cleandata.txt
awk ‘{if($0~/^#/ || $0 == “”); else{ print $0}}’ 17mer_shuxi.kmer.freq.stat | cut -f 1,2 > 17mer_shuxi.kmer.freq.stat.2colum
#在文件17mer_shuxi.kmer.freq.stat中查看kmer的种类数目——作为GCE参数-g的值40451775089
grep “#Kmer indivdual number” 17mer_shuxi.kmer.freq.stat

#GCE评估(第一次)
/home/zhaohuiyao/Biosoft/GCE-master/gce-1.0.2/gce -f 17mer_shuxi.kmer.freq.stat.2colum -g 40451775089 >17mer_shuxi.table 2> 17mer_shuxi.log

#GCE评估(第二次)
/home/zhaohuiyao/Biosoft/GCE-master/gce-1.0.2/gce -f 17mer_shuxi.kmer.freq.stat.2colum -g 40451775089 -H 1 -c 64 >17mer_shuxi_2.table 2> 17mer_shuxi_2.log

#在文件17mer_shuxi_2.log文件中查看以下信息
grep -A 1 “raw_peak” 17mer_shuxi_2.log
在这里插入图片描述
#依据genome_size、a[1/2]、a[1]、b[1/2]、b[1]值
#计算重复序列占比R=1-b[1/2]-b[1]=1-0.101873-0.279256=61.89%,杂合度H=[a[1/2]/(2-a[1/2])]/kmer_value=[0.270554/(2-0.270554)]/17=0.92%
#若计算的杂合度H<0.5%,则表示该物种是纯合物种,那么重复序列占比R需要重新计算,使用文件17mer_shuxi.log中的信息。R=1-b[1]=1-0.431343=56.87%
在这里插入图片描述
#因为杂合度H=0.92%≥0.5%,所以测序物种为杂合种。不需要重新计算重复序列占比R。

补充:一个简单的R脚本——kmerpdf.R,用于绘制kmer的种类和数量分布图

Rscript kmerpdf.R 17mer_shuxi.kmer.freq.stat.2colum 17mer_shuxi.kmer.freq.pdf 40451775089

args <- commandArgs(T)
df <- read.table(args[1])
colnames(df) <- c("kmer Depth","Species")
df$'Number'<- df$'kmer Depth'*df$'Species'
df$'Species_frequency(%)'=df$'Species'*100/sum(df$'Species')
df$'Number_frequency(%)'=df$'Number'*100/as.numeric(args[3])Spefreq_peak=round(max(df$'Species_frequency(%)'[10:nrow(df)])+0.2,1)
Numfreq_peak=round(max(df$'Number_frequency(%)'[10:nrow(df)])+0.2,1)pdf(args[2],height=8,width=10)par(pin=c(6,4))
plot(x=df$'kmer Depth',y=df$'Species_frequency(%)',type="l",xlim=c(0,250),ylim=c(0,Spefreq_peak),col="blue2",lwd=2,xlab="",ylab="",xaxs = 'i',yaxs = 'i',main="The distribution of kmer Depth")
mtext("Species_frequency(%)",side=2,line = 3,font=2);mtext("kmer Depth",side=1,line = 3,font=2)
axis(side=1,line=0,font=2);axis(side=2,line=0,font=2)par(new=TRUE)
plot(x=df$'kmer Depth',y=df$'Number_frequency(%)',type="l",xlim=c(1,250),ylim=c(0,Numfreq_peak),col="red2",lwd=2,xlab="",ylab="",xaxs = 'i',yaxs = 'i',xaxt="n",yaxt="n")legend("topright",legend=c("Species_frequency(%)","Number_frequency(%)"),col=c("blue2","red2"),lty=1,lwd=2,cex=0.8,bty="n")
dev.off()

#结果文件17mer_shuxi.kmer.freq.pdf
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/117580.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【VictoriaMetrics】单机版配置

为方便查看,释义都已翻译成中文,本文配置基于VictoriaMetrics 1.87.1版本 bigMergeConcurrencyint用于大合并的最大 CPU 核数。设置为 0 时使用默认值cacheExpireDuration30m0s

Docker基础知识

文章目录 Docker Docker 一次构建&#xff0c;处处运行&#xff0c;类似于JVM 虚拟机是软件硬件&#xff08;需要Hypervisors实现硬件资源虚拟化&#xff09;&#xff1a; 资源占用大启动慢&#xff08;虚拟机是分钟级&#xff0c;Docker是秒级&#xff09;冗余步骤多 sha2…

冒泡排序:了解原理与实现

目录 原理 实现 性能分析 结论 冒泡排序&#xff08;Bubble Sort&#xff09;是一种简单但效率较低的排序算法。它重复地比较相邻的元素并交换位置&#xff0c;直到整个序列有序为止。虽然冒泡排序的时间复杂度较高&#xff0c;但在小规模数据集上仍然具有一定的实际应用价…

【JavaEE】CAS -- 多线程篇(7)

CAS 1. 什么是 CAS2. CAS 伪代码3. CAS 是怎么实现的4. CAS的应用4.1 实现原子类4.2 实现自旋锁 5. CAS 的 ABA 问题 1. 什么是 CAS CAS: 全称Compare and swap&#xff0c;字面意思:”比较并交换“能够比较和交换 某个寄存器中的值和内存中的值, 看是否相等, 如果相等, 则把另…

[support2022@cock.li].faust、[tsai.shen@mailfence.com].faust勒索病毒数据怎么处理|数据解密恢复

引言&#xff1a; 威胁网络安全的恶意软件不断涌现&#xff0c;而[support2022cock.li].faust勒索病毒则是其中的一员。这个网络黑暗角落的新星&#xff0c;以其数据绑架的方式&#xff0c;一度成为数据安全的威胁焦点。本文将探究[support2022cock.li].faust勒索病毒的运作方…

全是干货!2023年双十一买什么最划算、双十一值得买的好物推荐

在双十一前选购到好物&#xff0c;打败99.99%的人&#xff01;看了下日历马上就要到一年一度的购物节了&#xff0c;双十一都想好买什么了吗朋友们&#xff1f;双十一购物狂欢即将来临&#xff0c;你是否已经开始准备购买自己心仪的商品&#xff1f;在这个购物狂欢节中&#xf…

华为ERP,包含哪些内容?技术的先进性体现在哪里?

华为作为全球领先的信息和通信技术&#xff08;ICT&#xff09;解决方案提供商&#xff0c;其企业资源规划&#xff08;ERP&#xff09;系统是一个高度复杂且集成的管理软件平台&#xff0c;用于优化公司内部的业务流程和资源分配。华为ERP系统包括一系列模块和功能&#xff0c…

【Jenkins 安装】

一&#xff1a;安装文件夹准备 在/home/admin 界面下新建三个文件夹&#xff0c;用来安装tomcat、maven 1.打开&#xff0c;/home/admin目录 cd /home/admin 2.新建三个文件夹 mkdir tomcat mkdir maven 二&#xff1a;安装tomcat 1.打开tomcat目录进行tomcat的安装 访问:h…

Rocksdb LSM Tree Compaction策略

RocksDB读写简介 直接画图说明。这张图取自Flink PMC大佬Stefan Richter在Flink Forward 2018演讲的PPT&#xff0c;笔者重画了一下。 RocksDB的写缓存&#xff08;即LSM树的最低一级&#xff09;名为memtable&#xff0c;对应HBase的MemStore&#xff1b;读缓存名为block cac…

文生图——DALL-E 3 —论文解读——第一版

概述 本文主要是DALLE 3官方第一版技术报告&#xff08;论文&#xff09;的解读&#xff0c;原文《Improving Image Generation with Better Captions》论文解读。该文要提升文生图的效果&#xff0c;将技术点放到了&#xff0c;提升指令跟随能力上&#xff0c;然后顺藤摸瓜分为…

深眸科技以需求定制AI视觉解决方案,全面赋能产品外观缺陷检测

产品外观是影响产品质量最重要的因素之一&#xff0c;其平整度、有无瑕疵等不仅影响到产品美观&#xff0c;甚至能够直接影响产品本身的使用和后续加工&#xff0c;给企业带来重大经济损失。 随着人工智能技术的快速发展&#xff0c;机器视觉与AI技术的结合应用加速渗透进工业…

国产开发板上打造开源ThingsBoard工业网关--基于米尔芯驰MYD-JD9X开发板

本篇测评由面包板论坛的优秀测评者“JerryZhen”提供。 本文将介绍基于米尔电子MYD-JD9X开发板打造成开源的Thingsboard网关。 Thingsboard网关是一个开源的软件网关&#xff0c;采用python作为开发语言&#xff0c;可以部署在任何支持 python 运行环境的主机上&#xff0c;灵…

vxe-table 打包部署上线,校验样式失效

正常效果 打包上线后的样式 样式失效原因&#xff0c;vue版本与vxe-table版本不兼容导致 版本 "vxe-table": "^4.3.5", "vxe-table-plugin-element": "^3.0.6", "xe-utils": "^3.5.4",由于vxe-table最新版本是4…

【Docker】联合探讨Docker:容器化技术的革命性应用

前言 Docker 是一个开源的应用容器引擎&#xff0c;让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux或Windows操作系统的机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。 &#x1f4d5;作者简介&#xff1a;热…

【大数据】Hadoop

文章目录 概述Hadoop组成HDFSMapReduce写MapReduce程序&#xff08;Hadoop streaming&#xff09; YARNHadoop 启动 工作方式Hadoop的主从工作方式Hadoop的守护进程 运行模式本地运行模式伪分布式运行模式完全分布式运行模式 Hadoop高可用的解决方案ZooKeeper quorumZKFC 环境搭…

基于STM32+华为云设计的智慧农业灌溉系统(2023升级版)

一、设计需求 基于STM32+华为云设计的智慧农业灌溉系统 【1】 项目背景 随着全球人口的不断增长和城市化进程的加速,农业生产面临着越来越大的挑战。作为传统的行业,农业生产需要不断地革新创新,以适应现代社会对食品安全、环境保护和资源利用的要求。同时,气候变化等因素…

C#编程学习

1. **C#简介**&#xff1a; - C#是一种现代的、面向对象的编程语言&#xff0c;由Microsoft开发。 - 它是.NET框架的一部分&#xff0c;用于开发Windows应用程序、Web应用程序和服务等。 2. **开发环境**&#xff1a; - 你可以使用Visual Studio或Visual Studio Code…

Kubernetes Etcd不可用日志:NOSPACE 的问题修复

两套k8s集群同一天同时出现etcd集群空间超过配额&#xff0c;kubectl get cs时发现所有的etcd均返回503报错&#xff0c;查看etcd的告警发现有NO SPACE的信息且 etcdctl --endpoints${ETCD_ENDPOINT} --cert${ETCD_CERTFILE} --key${ETCD_KEYFILE} --cacert${ETCD_CAFILE} endp…

postman接收后端返回的文件流并自动下载

不要点send&#xff0c;点send and download&#xff0c;postman接受完文件流会弹出文件保存框让你选择保存路径

【Sentinel】Sentinel簇点链路的形成

说明 一切节点的跟是 machine-root&#xff0c;同一个资源在不同链路会创建多个DefaultNode&#xff0c;但是在全局只会创建一个 ClusterNode machine-root/\/ \EntranceNode1 EntranceNode2/ \/ \DefaultNode(nodeA) DefaultNode(nodeA)|…