线粒体和叶绿体的基因组特点_如何组装植物叶绿体基因组

d3d3d2f3aa86c30564a057a3198c99b0.png

可能出现的问题:

*个人电脑上遇到不能collect memery的情况,是电脑内存较少,建议分成用2G左右的数据进行组装。

* Seed.fasta #用于起始组装的种子序列,NOVOPlasty安装软件目录下有这个文件,就叫这个名字,作者亲测还是这个种子序列最好用。

----------------------------------------------------------------

叶绿体是绝大多数陆生植物都有的细胞器,让人惊奇的是,植物叶绿体和线粒体一样,都有着自己一套遗传物质。本文介绍如何用高通量测序数据利用两款常用的叶绿体基因组组装软件(NOVOPlasty和Get Organelle)来组装完整的叶绿体基因组。

两个软件都是命令工行

1.软件安装

NOVOPlasty

1.1系统和语言安装

NOVOPlasty是由perl语言写的,先让自己的电脑安装perl语言的编译器,

https://www.perl.org/

建议使用Linux系统,电脑已经是linux 系统或者macos的就不用管了,windows系统可以下载subsystem for windows具体的操作就不再这里描述了,可以参考下面两个连接里面的内容。确保你的电脑是有大于等于8G的运行内存。

WSL(Windows Subsystem for Linux)的安装与使用​www.cnblogs.com
40c673740d01c2a0e6d79d702acb8497.png

安装好了运行Ubuntu 18的系统

1.2 NOVOPLasty 安装

在命令行输入

git clone ndierckx/NOVOPlasty

下载

ndierckx/NOVOPlasty​github.com
e4d15323f68e02d79f4c6162dc5190e2.png

上面的连接是NOVOPlasty在github的连接,有问题可以参考

1.3 运行NOVOPlasty

运行NOVOPlasty非常简单

perl +NOVOPLasty的安装路径/NOVOPlasty.pl -c config.txt

就可以了,重点在于NOVOPlasy的配置文件也就是cofig.txt的设置

Project:
-----------------------
Project name = #你的项目名称
Type = mito #组装类型叶绿体chloro 或者是线粒体mito
Genome Range = 12000-22000 #基因组的预估大小,基本上在16K左右吧,找个近缘物种看看大小
K-mer = 33 #用于组装的k-mer 的大小,并不是越大越好,一般不建议更改
Max memory = #最大运行内存
Extended log = 0
Save assembled reads = no
Seed Input = Seed.fasta #用于起始组装的种子序列,NOVOPlasty安装软件目录下有这个文件,作者亲测还是这个种子序列最好用,注意写绝对路径。
Extend seed directly = no
Reference sequence = /path/to/reference_file/reference.fasta (optional)#选填,参考的近缘物种参考序列
Variance detection = no
Heteroplasmy = #检测异质性的参数,不填
HP exclude list =
Chloroplast sequence = /path/to/chloroplast_file/chloroplast.fasta (only for "mito_plant" option) #组装植物线粒体的时候填,提供本物种的叶绿体序列
Dataset 1:
-----------------------
Read Length = 151#高通量reads读长
Insert size = 300 #插入片段大小,测序建库的时候有
Platform = illumina #目前只支持illumina等大公司,BGI不支持注意
Single/Paired = PE #双端测序还是单端测序
Combined reads =
Forward reads = /path/to/reads/reads_1.fastq #前reads的文件路径
Reverse reads = /path/to/reads/reads_2.fastq #后reads 的文件路径
Optional:
-----------------------
Insert size auto = yes
Use Quality Scores = no

直接更改config.txt文件内容就可以了。

1.4 结果解读

组装质量最好会出现一个circular assembly 的文件,不过一般情况下会有两个option,这两个文件都是正确的,是叶绿体的两个反向重复区域的基因顺序不确定造成的。这个时候想确定哪一个正确的时候,就要做基因注释或者PCR验证。

还有的时候文件会出现*的碱基,这个时候也是软件不能处理一些ambiguous的区域,需要人为将两端的序列比对一下,去掉*号,我组装的结果都没有出现这样的情况,但是对于结果也检查一下有无这种情况出现。

组装质量差的情况下,会出下多个option组装结果,或者仅有多个contigs,这个时候比较麻烦了,就要选择reference genome重新组装或者更换其他的软件,getorganelle也是用于组装叶绿体的软件,据这个软件作者来说,相较于NOVOPlasty有更高的准确性,NOVOplasty速度快,使用简单,能够满足大多数的需求。有时间再把getorganelle软件的用法写一写。

后期检查组装结果的话建议对基因组进行注释,软件推荐Geseq基因注释 rna注释,可视化真的是一键到位,操作也是非常傻瓜,有需要的话给大家介绍。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/534651.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

f3arra1n3.4.1版本_Sysmon v11.1新版本功能测试报告

一、概述根据微软文档的介绍,Sysmon v11新增了监控文件删除的功能,并支持对删除的文件进行存储备份,极大提高了主机威胁检测的能力。同时增加禁用反向DNS查询的功能,可以有效降低噪音数据。Sysmon从v10.0到目前的v11.1共经历了5个…

maya导出fbx没动画_Maya学习方法总结

关注我,一起来了解建模吧!今天小编就来总结一下Maya学习过程中遇到的困难和解决方法,我相信有一些应该也是普遍性问题,注意:小编说的版本是Maya2018。(1)一次性删除所有帧的方法import的文件如果…

dev 中 gridcontrol1 滚动条重绘_浏览器的重绘和回流(Repaint amp; Reflow)

参考文献:https://developers.google.com/web/fundamentals/performance/critical-rendering-path/render-tree-construction?hlzh-cn​developers.google.com你真的了解回流和重绘吗 Issue #4 chenjigeng/blog​github.com前言:重绘:由于…

矿井通风计算c语言_矿井通风机主要参数的含义

矿井通风机的作用就是把地面新鲜空气送到井下,供工人呼吸,同时把有害气体从井下排出,使有害气体的浓度降到对人体无害的程度,在现代化煤矿中称通风机为“矿井的肺脏”,可见其重要性。风机的参数是风机选型的唯一依据&a…

行健设计_行健要闻|“第四届‘天行健创新创业设计大赛”培训班成功举办

10月9日下午,由院团委主办、商学部承办第四届“天行健”创新创业设计大赛动员大会暨首场培训讲座在教学楼4-103室成功启动。院团委副书记唐典巧参加动员会,并颁发了第九届“挑战杯”广西大学生课外学术科技作品竞赛荣誉证书,动员会由商学部辅…

ip地址转换pta题目_PTA「实验2-3-5 输出华氏-摄氏温度转换表」

PTA是浙江大学设计类实验辅助教学平台。题目描述输入2个正整数lower和upper(lower≤upper≤100),请输出一张取值范围为[lower,upper]、且每次增加2华氏度的华氏-摄氏温度转换表。温度转换的计算公式:C5(F−32)/9&#…

语言爬虫字段为空_我为什么建议前端将Python 作为第二语言?

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。作者: 前端劝退师PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://note.youdao.com/noteshare?id3054c…

5 获取当前访问的控制名称_LabVIEW编程技巧:网络通信中如何获取计算机名称、IP地址等信息...

问题引出在网络通讯编程中,经常需要获取当前主机的名称、IP地址等信息,在LabVIEW中如何获取这些信息呢?下面以本机为例进行说明,先看一下本机的信息。在Windows系统中打开控制台程序,输入“ipconfig /all”指令&#x…

postman生成python代码_别再用手敲了,这个工具可以自动生成python爬虫代码

我们在写爬虫代码时,常常需要各种分析调试,而且每次直接用代码调试都很麻烦所以今天给大家分享一个工具,不仅能方便模拟发送各种http请求,还能轻松调试,最重要的是,可以将调试最终结果自动转换成爬虫代码&a…

电工结业试卷_电工技术基础结业考试试卷

电工技术基础结业考试试卷适用年级2016级秋6班电子、计算机专业班级 姓名 学号一、 判断题(每题2分,共30分)1、 电位越高则电压越大。2、万用表的电压、电路及电阻档的刻度都是均匀的。3、 在任何情况下,电压源和电流源之间总是可以等效变换的。 4、 电容…

表格里面怎么打多个√_Excel怎样在表格里打√?

我们做表的时候有时会遇到输入对或错的情况。Excel表格里面输入√和,普通的方法是直接插入特殊符号来进行对勾的输入。这样输入起来1个2个还可以接受,但是如果频繁输入,那我们得想想简单方法。比如我们直接在excel单元格里面输入1显示√&…

@value 默认值为null_JAVA8之妙用Optional解决判断Null为空的问题

引言在文章的开头,先说下NPE问题,NPE问题就是,我们在开发中经常碰到的NullPointerException.假设我们有两个类,他们的UML类图如下图所示在这种情况下,有如下代码user.getAddress().getProvince();这种写法,…

mysql百万数据根据索引查询_mysql创建多列索引查询百万表数据的性能优化经验分享...

最近发现最代码网站中的收到的评论,提到我的,心情被赞的查询异常缓慢,通过nginx日志发现响应时间快的在5s,慢的有13s,终于忍无可忍花时间来解决了。执行explain之后的截图如下:可以看到possible_keys中有很…

php用到的mysql语句_PHP中常用到的一些MySQL语句_php

在php开发中,经常会使用到mysql语句,下面就为您列举了一些经常使用的MySQL语句,希望对您平时的学习和开发工作能起到些许的作用。MySQL语句显示数据库或表:show databases;//然后可以use database_name;show tables;MySQL语句更改表名:alter …

mysql执行计划性能_MySQL SQL性能分析Explain执行计划

一. 执行计划返回信息详解①. 执行计划所含字段输出列含义id查询标识select_type查询类型table查询涉及的表partitions匹配到的分区信息type连接类型possible_keys可能选择的索引key实际使用的索引key_len实际使用的索引的长度ref和索引进行比较的列rows需要被检索的大致行数fi…

mysql定时作业_mysql 让一个存储过程定时作业的代码(转)

1、在mysql 中建立一个数据库 test1语句:create database test12、创建表examinfocreate table examinfo(id int auto_increment not null,endtime datetime,primary key(id));3 插入数据:insert into examinfo values(‘1‘,‘2011-4-23 23:26:50‘);4 …

table虚线边框_web前端工程师7天0基础到精通(TABLE+CSS制作《互联世纪网》)

项目七 项目实践:TABLECSS制作《互联世纪网》实践目标1、 熟悉CSS属性2、 熟练运用CSS属性控制网页样式3、 熟悉网页制作流程项目简介:通过上一章节的学习,我们了解了CSS样式能更加方便、有效地控制网页结构和布局网页元素,大大提…

mixamo骨骼_mixamo动作库的模型和动作绑定控制器的方法-上集

1.首先从网站下载带调好动作的文件fbx,我们将fbx场景文件转换成c4d场景文件。没转换之前转换之后选择场次,在文件菜单里找到当前场次到新文档!2.我们将模型重置为Tpose方便后续操作,没重置之前模型为k好的动作模式不能使用选中权重…

mysql 101_MySQL 调优/优化的 101 个建议!

原文:http://www.monitis.com/blog/101-tips-to-mysql-tuning-and-optimization/MySQL是一个强大的开源数据库。随着MySQL上的应用越来越多,MySQL逐渐遇到了瓶颈。这里提供 101 条优化 MySQL 的建议。有些技巧适合特定的安装环境,但是思路是相…

数据安全:保护个人隐私和企业机密的关键

在当今数字化时代,数据已经成为了一种宝贵的资源。无论是个人还是企业,都离不开数据的支持。然而,随着数据的不断增长和广泛应用,数据安全问题也日益突出。数据泄露、黑客攻击、网络诈骗等安全事件层出不穷,给个人和企…