gff3转mysql_科学网-把GFF3文件导入MySQL数据库-闫双勇的博文

什么是GFF3?这个一种序列注释文件的格式,基因组注释数据常常会用这种格式来记录序列注释信息,关于这种格式的更多信息,可以在这里学习:http://www.sequenceontology.org/gff3.shtml

这里简单说下,怎样把GFF3文件导入MySQL数据库,导入了以后使用比较方便。我用的是ubuntu 14.04系统。如果使用其它系统的,仅供参考。系统需要安装MySQL数据库以及bioperl,关于bioperl有兴趣的朋友可以到这里序列(www.bioperl.org),关于perl和MySQL这里也提供点我云盘里的参考资料:http://yunpan.cn/cK3zPydGY6c7Q (提取码:36ad)

1 在MySQL数据库中建立一个用于储存GFF3格式数据的数据库

mysql> create database MUS_7 -u root -p  XXXXXXXX;

其中create database是MySQL中的命令,MUS_7是新建的数据库名,-u选项,表示用户名,用户名参数为root,-p 参数后接MySQL数据库的密码。这样就能建立一个名为MUS_7的数据库

2 将GFF3文件导入MySQL数据库中

从网上下载GFF3格式的文件,如从rice_r7_all_tilling_path.gff3,然后用下列命令导入MySQL数据库

bp_seqfeature_load -f   -c -d MUS_r7 -u root -p xxxxxxxx all.gff3 all.con

bp_seqfeature_load是一个脚本文件,所以系统中需要有这个脚本文件。关于这个脚本的用法可以用命令bp_seqfeature_load查询。-f选项的含义:

Activate fast loading. (default 0) Only available for some adaptors.

-c选项的含义:

Create the database and reinitialize it (default false) Note, this

will erase previous database contents, if any

如果是新建的数据库需要用这个选项,如果是往已有的数据库中添加数据,用这个选项就坏菜了,把原来数据都清除了

-d MUS_r7,表示导入的数据库为MUS_r7,-u -p及后面的参数和上文含义相同。all.gff3为GFF3文件。all.com,为和gff3文件对应的参考序列。这个得配套,要不然肯定会报错。

我传的all.gff3文件大小为:78M,all.con文件为:365M。文件比较大,要把这些东西都传上去,得花不少时间,总时间为:63245.07秒,17.5小时。插入后的效果图如下。

8d04f68e634a376713fdfacb0cc411ff.png

我的MySQL数据库中有三套水稻基因组的注释数据。这三套数据,参考序列都是一样的,但注释数据则不一样,所以对同一个水稻基因组序列,利用这三套数据同时分析,可能得到的信息会更多。当然,这个数据也可以和其它数据,如全基因组的多态信息进行整合,这样使用更加方便

转载本文请联系原作者获取授权,同时请注明本文来自闫双勇科学网博客。

收藏

分享

分享到:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/508304.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql时间字段不走索引_MySQL使用=或=范围查询时不走索引

2020-02-27最近一个日志页面查询很慢,然后去跟踪了查询sql,发现日期字段上即使建了索引,查询还是很慢,执行语句还是使用了全表扫描,于是继续分析下去。查询语句类似:select * from logs where createtime > 2020-01…

指数函数中x的取值范围_指数函数x的取值范围是

1、指数函数x的取值范围是a>0且a不1;2、指数函数是重要的基本初等函数之一。一般地,yax函数(a为常数且以a>0,a≠1)叫做指数函数,函数的定义域是 R ;3、,在指数函数的定义表达式中,在ax前的…

java excutorthread_JAVA 线程池ThreadPoolExcutor原理探究

概论线程池(英语:thread pool):一种线程使用模式。线程过多会带来调度开销,进而影响缓存局部性和整体性能。而线程池维护着多个线程,等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价。线程…

websocket连接mysql_websocket 使用 spring 的service层 ,进而调用里面的 dao层 来操作数据库 ,包括redis、mysql等通用...

1.前言描述一下今天用websocket踩得坑 ---》空指针异常!我想在websocket里面使用service 层的接口,从中获取数据库的一些信息 ,使用 Autowired 注解 接口 ,报错 空指针异常 !!!查过资料才发…

世上最简单的mysql_最简单易懂的mysql安装教程

今天安装MySQL花了蛮长时间的,感觉坑还是挺多的,写遍文章总结一下。一、安装1.解压zip包到安装目录先从MySQL官网 下载mysql最新的免安装版压缩包解压之后变成这个样子:里面的文件是这个样子下面开始了,请注意2.配置文件在安装目录…

aix系统升级失败提示java_AIX系统补丁升级失败处理

问题描述:现网一台IBM P550小型机,初始版本通过oslevel –r命令检查为5300-02,在IBM官方网站下载5300-06补丁并升级到5300-06后系统报错,缺少sysmgt.websm.apps 5.3.0.60,sysmgt.websm.rte 5.3.0.60两个文件问题处理&a…

java arraylist char,Java基础学习笔记六 Java基础语法之类和ArrayList详解

引用数据类型引用数据类型分类,提到引用数据类型(类),其实我们对它并不陌生,如使用过的Scanner类、Random类。我们可以把类的类型为两种:第一种,Java为我们提供好的类,如Scanner类,Random类等&a…

matlab 数值解 期权顶级啊,潮盈期权院高胜率交易技巧系列之二----期权交易策略及基于MATLAB统计套利介绍...

主题:高胜率交易技巧系列之二----期权交易策略及基于MATLAB统计套利介绍会场流程:13:30--14:00:参会嘉宾到场签名14:00--14:45:期权知识14:45--15:25:期权交易策略使用15:25--15:35:茶歇15:35--16:35&#…

php的用例图箭头怎么画,需求中如何画用例图 - china008的个人空间 - OSCHINA - 中文开源技术交流社区...

UML用例图用例图主要用来图示化系统的主事件流程,它主要用来描述客户的需求,即用户希望系统具备的完成一定功能的动作,通俗地理解用例就是软件的功能模块,所以是 设计系统分析阶段的起点,设计人员根据客户的需求来创建…

oracle学习数据,Oracle从入门到精通的学习笔记

本次知识点:1.认识SQL的介绍2.掌握scott用户的数据结构3.查询语句之简单查询1.SQL:SQL是指结构化查询语言,在80年代的时候,基本存在80多种数据库,每一种数据库都有自己的的操作命令,也就导致了程序员从一个数据库到另一个数据库的转化时变的极为麻烦,基本就要从新学习.在70年代…

强行更改linux服务器时间,加强Linux服务器安全的20项建议

一般情况下用 Linux 做桌面在默认配置下是很安全的,我在一定程度上同意这个说法(很值得商榷的话题)。不过 Linux 内置的安全模型和工具做得确实很到位,用户只需进行简单的调整和自定义就可以加强 Linux 服务器安全。与恶意用户做斗争对于所有 Linux 系统…

linux终端提示符含义,Linux:终端提示符 (prompt) 不如期生效原因

前言先来简单介绍下, prompt是什么鬼? 顾名思义就是提示符的意思, 看起来和我们遥远, 但实际上只要是每个接触shell的童鞋, 都有看到, 那就是我们在输命令时前面的那串提示符.例如:当然, 这个样式是可以修改的, 这就涉及到我们的PS1和PS2了, 有经验或者以前有设置过的童鞋估计…

skyeye linux qt,ARM仿真器SkyEye的安装及使用

SkyEye是一个开源软件(OpenSource Software)项目,中文名字是"天目"。SkyEye的目标是在通用的Linux和Windows平台上实现一个纯软件集成开发环境,模拟常见的嵌入式系统,可在SkyEye上运行μCLinux以及μC/OS-II等,以及各种…

2g 双核电脑 linux,9208)(奔腾双核E5200/2G/320G)电脑详细技术

处理器型:intel 酷睿2双核 p7350 intel 酷睿2双核 p7450 intel 酷睿2双核 t6600 intel 奔腾双核t4300 intel 奔腾双核 t4400 intel 赛扬双核 t1600 intel 赛扬双核 t3000操作系统:windowsvista home basic dos标配内存:1gb 2gb 硬盘容量&…

linux apache 大文件,Apache下error.log文件太大的处理方法

Apache下error.log文件太大的处理方法2019年05月03日| 萬仟网网络运营| 我要评论清除error.log、access.log并限制apache日志文件大小的方法 有个客户反映vps网站打不开,登录系统检查下,客户是win2003系统,发现放置网站文件的清除error.log、…

c语言程序设计实践课选题,c语言程序设计实践实验题目

c语言程序设计实践实验题目 绥化学院程序设计实践实验报告范例 参考1实验题目:循环结构程序设计实验目的:1.熟悉 VC6.0 的运行环境,掌握 C 程序的执行方法;2.掌握三种基本数据类型、部分运算符号和常用函数;3.掌握三种…

c语言上机指导答案清华,第一章自测练习答案清华大学c语言习题实验指导及课程设计...

第一章自测练习答案清华大学c语言习题实验指导及课程设计 第一章 自测练习参考答案 一.简答题 1.源程序是程序员创建的,目标程序是编译器创建的,可执行程序是连接器创建的。 2.步骤如下:1)说明程序需求&…

k6前级效果器怎么用_新手学习电吉他,效果器应选择单块还是综合?

作为一个新手来说,我建议一开始先选择综合型效果器。这里我们先简单介绍下综合效果器与单块效果器。综合效果器可以理解为多个单块的综合体,即包含了很多种效果。一块大综合效果器可能就有三四十种预置音色,有过载、失真、法滋、延迟、混响、…

android百度多渠道打包,Android多渠道打包方案的实践与优化

目前使用过的多渠道打包方式有两种 ,一种是通过gradle打包,还有一种是美团的多渠道打包方案具体详情见这里1、Gradle打包1.1、在Androidmanifest.xml中添加android:name"UMENG_CHANNEL"android:value"${UMENG_CHANNEL_VALUE}" />…

一张图 综合交通 解决方案_航天智慧环保 | 重庆跳蹬河智慧水务管理系统解决方案—应用篇...

导读随着社会信息化趋势的不断增强,信息社会作为人类社会环境的一个重要方面,在社会中的地位和作用日益显著。在环境监测领域,对有效信息的把握以及正确的使用与水污染的防治和水环境的管理密切相关。航天智慧公司发挥航天系统工程优势&#…