gff3转mysql_科学网-把GFF3文件导入MySQL数据库-闫双勇的博文

什么是GFF3?这个一种序列注释文件的格式,基因组注释数据常常会用这种格式来记录序列注释信息,关于这种格式的更多信息,可以在这里学习:http://www.sequenceontology.org/gff3.shtml

这里简单说下,怎样把GFF3文件导入MySQL数据库,导入了以后使用比较方便。我用的是ubuntu 14.04系统。如果使用其它系统的,仅供参考。系统需要安装MySQL数据库以及bioperl,关于bioperl有兴趣的朋友可以到这里序列(www.bioperl.org),关于perl和MySQL这里也提供点我云盘里的参考资料:http://yunpan.cn/cK3zPydGY6c7Q (提取码:36ad)

1 在MySQL数据库中建立一个用于储存GFF3格式数据的数据库

mysql> create database MUS_7 -u root -p  XXXXXXXX;

其中create database是MySQL中的命令,MUS_7是新建的数据库名,-u选项,表示用户名,用户名参数为root,-p 参数后接MySQL数据库的密码。这样就能建立一个名为MUS_7的数据库

2 将GFF3文件导入MySQL数据库中

从网上下载GFF3格式的文件,如从rice_r7_all_tilling_path.gff3,然后用下列命令导入MySQL数据库

bp_seqfeature_load -f   -c -d MUS_r7 -u root -p xxxxxxxx all.gff3 all.con

bp_seqfeature_load是一个脚本文件,所以系统中需要有这个脚本文件。关于这个脚本的用法可以用命令bp_seqfeature_load查询。-f选项的含义:

Activate fast loading. (default 0) Only available for some adaptors.

-c选项的含义:

Create the database and reinitialize it (default false) Note, this

will erase previous database contents, if any

如果是新建的数据库需要用这个选项,如果是往已有的数据库中添加数据,用这个选项就坏菜了,把原来数据都清除了

-d MUS_r7,表示导入的数据库为MUS_r7,-u -p及后面的参数和上文含义相同。all.gff3为GFF3文件。all.com,为和gff3文件对应的参考序列。这个得配套,要不然肯定会报错。

我传的all.gff3文件大小为:78M,all.con文件为:365M。文件比较大,要把这些东西都传上去,得花不少时间,总时间为:63245.07秒,17.5小时。插入后的效果图如下。

8d04f68e634a376713fdfacb0cc411ff.png

我的MySQL数据库中有三套水稻基因组的注释数据。这三套数据,参考序列都是一样的,但注释数据则不一样,所以对同一个水稻基因组序列,利用这三套数据同时分析,可能得到的信息会更多。当然,这个数据也可以和其它数据,如全基因组的多态信息进行整合,这样使用更加方便

转载本文请联系原作者获取授权,同时请注明本文来自闫双勇科学网博客。

收藏

分享

分享到:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/508304.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql时间字段不走索引_MySQL使用=或=范围查询时不走索引

2020-02-27最近一个日志页面查询很慢,然后去跟踪了查询sql,发现日期字段上即使建了索引,查询还是很慢,执行语句还是使用了全表扫描,于是继续分析下去。查询语句类似:select * from logs where createtime > 2020-01…

php mysql关键技术_中高级PHP开发者应该掌握哪些技术?

1.Linux能够流畅的使用Shell脚本来完成很多自动化的工作;awk/sed/perl 也操作的不错,能够完成很多文本处理和数据统计等工作;基本能够安装大 部分非特殊的Linux程序(包括各种库、包、第三方依赖等等,比如MongoDB/Redis/Sphinx/Lun…

python 简单socket_Python 简单socket

OSI七层模型(Open System Interconnection,开放式系统互联)应用层表示层回话层传输层 tcp,udp网络层 ip,icmp数据链路层 mac地址物理层 物理网卡服务端:import socket#实例化,绑定,监听,等待,解构(标识,ip-…

wxpython有哪些基本功能_用Python中的wxPython实现最基本的浏览器功能

通常,大多数应用程序通过保持 HTML 简单来解决大多数浏览器问题 ― 或者说,根据最低共同特性来编写。然而,即便如此,也仍然存在字体和布局的问题,发行新浏览器和升级现有浏览器时,也免不了测试应用程序的痛…

python增删改查mysql_python对数据库mysql的操作(增删改查)

#codingutf-8import pymysql# #查询# def connMySQL():# try:# connpymysql.connect(‘localhost‘,‘root‘,‘admin‘)# conn.select_db(‘five‘)# except Exception as e:# return e.args# else:# curconn.cursor()# cur.execute("select * from users")# datacu…

指数函数中x的取值范围_指数函数x的取值范围是

1、指数函数x的取值范围是a>0且a不1;2、指数函数是重要的基本初等函数之一。一般地,yax函数(a为常数且以a>0,a≠1)叫做指数函数,函数的定义域是 R ;3、,在指数函数的定义表达式中,在ax前的…

java创建response对象_创建一个HttpResponse对象

创建一个HttpResponse对象HttpResponse类实现了javax.servlet.http.HttpServletResponse。跟随它的是一个叫做 HttpResponseFacade的faade类。Figure 3.3显示了HttpResponse类和它的相关类的UML图。在第2章中,你使用的是一个部分实现的HttpResponse类。例如&#xf…

java编译机制_java的编译机制

我们通常写的文件都是java文件,最后要在JVM上运行则需要将java文件编译成class(二进制文件).各厂商在实现JDK时通常会符合java语言规范的源码编译为class文件的编译器.编译器的好坏很大程度上决定了最后程序在机器上执行效率.通常使用Sun JDK(javac).javac将java源码编译成clas…

java excutorthread_JAVA 线程池ThreadPoolExcutor原理探究

概论线程池(英语:thread pool):一种线程使用模式。线程过多会带来调度开销,进而影响缓存局部性和整体性能。而线程池维护着多个线程,等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价。线程…

java 继承作用_java三大特性之继承

继承(extends):让类与类之间产生关系,子父类的关系继承的好处与弊端:好处:提高代码的复用性提高了代码的维护性让类与类之间产生关系,是多态的前提弊端:类的耦合性增加开发的原则是:1、高内聚&a…

java gui 单选_java GUI编程(swing)之三swing单选框复选框组件

swing复选框(JCheckBox) 单选框(JRadioButton)特别说明:同一组单选按钮,必须先创建一个ButtonGroup,然后把单选按钮放到ButtonGroup中package gui;import javax.swing.JButton;import javax.swing.JFrame;import javax.swing.JPanel;import j…

websocket连接mysql_websocket 使用 spring 的service层 ,进而调用里面的 dao层 来操作数据库 ,包括redis、mysql等通用...

1.前言描述一下今天用websocket踩得坑 ---》空指针异常!我想在websocket里面使用service 层的接口,从中获取数据库的一些信息 ,使用 Autowired 注解 接口 ,报错 空指针异常 !!!查过资料才发…

世上最简单的mysql_最简单易懂的mysql安装教程

今天安装MySQL花了蛮长时间的,感觉坑还是挺多的,写遍文章总结一下。一、安装1.解压zip包到安装目录先从MySQL官网 下载mysql最新的免安装版压缩包解压之后变成这个样子:里面的文件是这个样子下面开始了,请注意2.配置文件在安装目录…

java if hasvalue_首选:可为空 .HasValue或Nullable !=空吗?

我一直使用Nullable<>.HasValue因为我喜欢这种语义。 但是&#xff0c;最近我正在开发其他人的现有代码库&#xff0c;其中他们专门使用Nullable<> ! null 。是否有理由优先使用一个&#xff0c;还是纯粹是偏爱&#xff1f;int? a; if (a.HasValue) // ...与int?…

Java 源程序的良好书写规范有哪些_使用Java作为程序语言时,好的命名规范有哪些...

变量名普通变量命名应该采用首字母小写&#xff0c;其他字母首字母大写的方式。final static变量的名字应该都大写&#xff0c;并且指出完整含义。如果一个常量名称由多个单词组成&#xff0c;则应该用下划线来分割这些单词如。NUM_DAYS_IN_WEEK MAX_VALU如果需要对变量名进行缩…

java邮箱exchange_使用Javamail访问Microsoft Exchange邮箱(IMAP,MS Exchange)

我需要通过IMAPS JavaMail连接到Microsoft Exchange Server.首先,我得到了&#xff1a;A1 NO AUTHENTICATE failed.javax.mail.AuthenticationFailedException: AUTHENTICATE failed.我的调试器中的异常.然后,我禁用了一些身份验证协议&#xff1a;imapProps.setProperty("…

java.equal例子_Java中的== 和equals()方法详解与实例

Java中的 和equals()方法&#xff1a;Java中的数据类型&#xff0c;可分为两类&#xff1a;1.基本数据类型&#xff0c;也称原始数据类型。byte,short,char,int,long,float,double,boolean&#xff0c;他们之间的比较&#xff0c;应用双等号(),比较的是他们的值。2.引用数据类型…

aix系统升级失败提示java_AIX系统补丁升级失败处理

问题描述&#xff1a;现网一台IBM P550小型机&#xff0c;初始版本通过oslevel –r命令检查为5300-02&#xff0c;在IBM官方网站下载5300-06补丁并升级到5300-06后系统报错&#xff0c;缺少sysmgt.websm.apps 5.3.0.60&#xff0c;sysmgt.websm.rte 5.3.0.60两个文件问题处理&a…

java 序列化工具kryo_java jackson avro kryo等几种序列化与反序列化工具的使用

最近由于工作需要&#xff0c;需要研究常用的集中序列化方式&#xff0c;主要目的是对象序列化后占用空间会大大减少&#xff0c;便于存储和传输&#xff0c;下面是几种序列化方式的使用demo1. Java自带的Serialize依赖jar包&#xff1a;无代码示意&#xff1a;import java.io.…

Java反射设置list的属性值_利用java反射比较两个实体有哪些属性值不一样

分享一个利用反射实现比较两个实体属性值的方法&#xff1a;package net.zwq1105.test;import java.beans.Introspector;import java.beans.PropertyDescriptor;import java.lang.reflect.Method;import java.sql.Timestamp;import java.util.ArrayList;import java.util.Array…