生物笔记——暑期学习笔记（三）

news/2025/4/27 0:42:07/文章来源:https://blog.csdn.net/2301_78630677/article/details/132132571

生物笔记——暑期学习笔记（三）

文章目录

前言
一、R篇
- 1. 数据筛选
- 2. 字符串处理
- 3. 练习
二、生信篇
- 1. blast 基因家族鉴定
- 2. hmm鉴定
- 3. 理化性质与亚细胞定位
- 4. 基因重复类型分析
- 5. 家族成员染色体位置分析
- 6. 基因组共线性分析
- 7. 多序列比对，构树
- 8. Ka/Ks分析
- 9. GO、KEGG富集分析
- 10. 基因家族Motif 分析
总结

前言

这一系列文章主要是对于在暑期，老师每周教导的生信方面的课程的课后学习笔记的总结，希望用此方法来巩固我的所学。

一、R篇

1. 数据筛选

情景：
假设有一个基因表达矩阵x
目标：

筛选出在样本A中基因表达值大于10、在样本B中小于8、在样本C中与样本D中表达值相差超过或等于2的基因，并返回基因ID。
筛选出所有基因表达量都为0的基因

x <- data.frame(A =c(7:15,0),B = c(2:10,0), C = c(3:11,0),D = c(0:8,0),row.names = paste("gene",seq(1,10),sep = "_"))
> xA  B  C D
gene_1   7  2  3 0
gene_2   8  3  4 1
gene_3   9  4  5 2
gene_4  10  5  6 3
gene_5  11  6  7 4
gene_6  12  7  8 5
gene_7  13  8  9 6
gene_8  14  9 10 7
gene_9  15 10 11 8
gene_10  0  0  0 0#str(x)tiaojian <- x["A"]>10 & x["B"]<8 & abs((x["C"]-x["D"]))>=2
x1 <- x[tiaojian,]> x1A B C D
gene_5 11 6 7 4
gene_6 12 7 8 5#返回满足条件的基因ID
> row.names(x1)
[1] "gene_5" "gene_6"#或者直接用which返回索引，再根据索引返回满足条件的基因
> which(tiaojian)
[1] 5 6
> x[which(tiaojian),]A B C D
gene_5 11 6 7 4
gene_6 12 7 8 5#筛选出所有基因表达量都为0的基因
tiaojian <- rowSums(x==0) == ncol(x)
x2 <- x[tiaojian,]
> row.names(x2)
[1] "gene_10"
#或者
tiaojian <- x$A ==0 & x$B == 0 & x$C==0 & x$D ==0
x2 <- x[which(tiaojian),]
rownames(x2)

2. 字符串处理

#paste函数
> paste("x",c(1:3),sep="*")
[1] "x*1" "x*2" "x*3#nchar函数
> nchar("星石传说")
[1] 4
> nchar("sjfakjfa")
[1] 8
> paste(c("星", "石","传","说"), collapse = "")
[1] "星石传说"#字符串替换
x <- "1,3;5,6,7;8,9"
> gsub(";",",",x,fixed = TRUE)
[1] "1,3,5,6,7,8,9"
> sub(";",",",x,fixed = TRUE)
[1] "1,3,5,6,7;8,9"
> chartr("asx","xwb","xingshichuangshuo")
[1] "bingwhichuxngwhuo"#正则表达式
> gsub("[[:space:]]+"," ", "a     cat in a box",perl = TRUE)
[1] "a cat in a box"
text <- "hello world"
is_match <- grepl("[A-Z]", text)  #匹配text中是否包含大写字母
> is_match
[1] FALSE

3. 练习

情景：
假设有一个包含DNA序列的字符向量dan_seq
目标：
将序列转为大写字母，且进行碱基互补，再将所有序列按字典顺序排列，最后合并为一段长序列。

dan_seq <- c("atgcgta","cgtacg","ttgga","gcat")
dan_seq <- toupper(dan_seq)
> dan_seq
[1] "ATGCGTA" "CGTACG"  "TTGGA"   "GCAT"   chartr("TAGC", "ATCG", dan_seq)
> dan_seq
[1] "TACGCAT" "GCATGC"  "AACCT"   "CGTA"   dan_seq <- sort(dan_seq)
> dan_seq
[1] "AACCT"   "CGTA"    "GCATGC"  "TACGCAT"new_seq<- paste(dan_seq,collapse = "")
> new_seq
[1] "AACCTCGTAGCATGCTACGCAT"

二、生信篇

1. blast 基因家族鉴定

基因家族成员鉴定（一）

2. hmm鉴定

生物笔记——暑期学习笔记（四）

3. 理化性质与亚细胞定位

理化性质与亚细胞定位
亚细胞定位
pyhton爬虫学习一

4. 基因重复类型分析

鉴定不同基因的重复模式

5. 家族成员染色体位置分析

家族成员染色体位置分析

6. 基因组共线性分析

基因组共线性分析

7. 多序列比对，构树

多序列比对，构树

8. Ka/Ks分析

Ka/Ks分析

9. GO、KEGG富集分析

10. 基因家族Motif 分析

基因家族Motif分析

总结

本文的R篇主要讲述了使用which()返回索引来进行数据筛选，以及一些字符串处理函数： paste() 、nchar() 、gsub() 、chartr() 等。而生信篇则主要讲述了在基因家族分析中的一些分析。

山一程，水一程，身向榆关那畔行，夜深千帐灯。

–2023-8-28 笔记篇

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/60399.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【seaweedfs】3、f4: Facebook’s Warm BLOB Storage System 分布式对象存储的冷热数据

【seaweedfs】3、f4: Facebook’s Warm BLOB Storage System 分布式对象存储的冷热数据

论文地址 Facebook的照片、视频和其他需要可靠存储和快速访问的二进制大型对象(BLOB)的语料库非常庞大，而且还在继续增长。随着BLOB占用空间的增加，将它们存储在我们传统的存储系统-- Haystack 中变得越来越低效。为了提高我们的存储效率(以Blob的有效复…

阅读更多...

node18 vue2启动报错 error:0308010C:digital envelope routines::unsupported

node18 vue2启动报错 error:0308010C:digital envelope routines::unsupported

出现原因貌似是因为是因为 node 17版本开始发布的OpenSSL3.0, 而OpenSSL3.0对允许算法和密钥大小增加了严格的限制，可能会对生态系统造成一些影响。解决方法第一种方法降低node版本降低到17以下即可 ，如项目不能降低版本看后面的解决方式第二…

阅读更多...

axios 和fetch的取舍，以及比较

axios 和fetch的取舍，以及比较

废话不多说，直接直捣黄龙： 区别相同点都是一种基于promise的异步解决方案。都可以解决回调地狱问题不同点 axios是一个封装好的库，需要npm进行安装，fetch是es6新增的api 语法： fetch(url, { method: GET, // o…

阅读更多...

问题杂谈（三十七）远程调试linux中的Tomcat

问题杂谈（三十七）远程调试linux中的Tomcat

前言之前调试过Docker里面的java程序，但还没试过直接调试tomcat里面的java程序，今儿个来试试步骤 Tomcat 修改catlina脚本：vi catlina.sh（bin目录下）找到下面这句，将"localhost:8000"改为”…

阅读更多...

【单片机】有人 WH-LTE-7S1 4G cat1 模块，HTTPD模式，字符串传输，文件传输。GPRS模块连接服务器教程。

【单片机】有人 WH-LTE-7S1 4G cat1 模块，HTTPD模式，字符串传输，文件传输。GPRS模块连接服务器教程。

文章目录 1、配置模块为HTTPD模式 POST字符串传输2、配置模块为HTTPD模式 GET请求3、上一篇文章：https://qq742971636.blog.csdn.net/article/details/132571592 在上一篇文章里，已经通过TCP 长链接进行服务器与Cat1 GPRS 模块进行双向通信。已经能够满…

阅读更多...

程序与进程

程序与进程

一、程序是怎么被执行的 1.在程序中，由引导代码去调用程序中得main函数，而这个过程由链接器完成，链接器将引导代码链接到我们的应用程序构成可执行文件。 2.程序运行需要通过操作系统的加载器来实现，加载器是操作系统中的程序&a…

阅读更多...

C++ 构造函数、析构函数调用虚函数

C++ 构造函数、析构函数调用虚函数

C虚函数是通过虚表实现的，虚函数的地址记录在虚表中，只对象完成构造完成后，虚函数的地址才最终确定。构造函数中调用虚函数基类先于派生类构造，所以构造时没法调用到派生类的虚函数，也就是说只能调用到自己这一层&…

阅读更多...

Java学数据结构（4）——散列表Hash table 散列函数哈希冲突

Java学数据结构（4）——散列表Hash table 散列函数哈希冲突

目录引出散列表Hash table关键字Key和散列函数(hash function)散列函数解决collision哈希冲突（碰撞）分离链接法(separate chaining)探测散列表(probing hash table)双散列(double hashing) Java标准库中的散列表总结引出 1.散列表，key&…

阅读更多...

力扣88.合并两个有序数组

力扣88.合并两个有序数组

88. 合并两个有序数组提示简单 2.1K 相关企业给你两个按非递减顺序排列的整数数组 nums1 和 nums2，另有两个整数 m 和 n ，分别表示 nums1 和 nums2 中的元素数目。请你合并 nums2 到 nums1 中，使合并后的数组同样按非递减顺序 …

阅读更多...

document.all 的详解

document.all 的详解

all 方法最初是由 IE 浏览器拥有的，并不属于 W3C 规范范畴，他返回调用 all 方法的 HTML 标记自身内的所有子孙元素的 HTML 标记集合。 all 方法的详细说明请参见 MSDN：http://msdn.microsoft.com/en-us/library/ms537434(VS.85).aspx。通…

阅读更多...

java8 IntStream.range

java8 IntStream.range

简介 IntStream.range是Java 8中的一个方法，它是java.util.stream.IntStream类中的静态方法。这个方法用于生成一个顺序排列的整数流，包含起始值但不包含结束值。可以使用以下代码调用IntStream.range方法： IntStream.range(int startInclu…

阅读更多...

关于JavaScript中Set的操作和应用

关于JavaScript中Set的操作和应用

目录 JavaScript中Set的操作和应用Set的基本操作创建Set添加元素删除元素判断元素是否存在获取Set的长度清空Set Set的遍历for...of循环forEach方法转换成数组后遍历使用Set的entries方法遍历 Set的应用数组去重判断两个数组是否有重复元素实现并集、交集和差集总结 JavaScrip…

阅读更多...

云和恩墨面试（部分）

云和恩墨面试（部分）

一面软件架构设计方案应该包含哪些内容，哪些维度二面架构师如何保证软件产品质量线程屏障(或者说线程栅栏)是什么，为什么要使用线程屏障事务传播⾏为为NESTED时，当内部事务发生异常时，外部事务会回滚吗？newBing:…

阅读更多...

ThinkPHP 集成 jwt 技术 token 验证

ThinkPHP 集成 jwt 技术 token 验证

ThinkPHP 集成 jwt 技术 token 验证一、思路流程二、安装 firebase/php-jwt三、封装token类四、创建中间件，检验Token校验时效性五、配置路由中间件六、写几个测试方法，通过postman去验证一、思路流程客户端使用用户名和密码请求登录服务端收到请求&…

阅读更多...

论文阅读 FCOS: Fully Convolutional One-Stage Object Detection

论文阅读 FCOS: Fully Convolutional One-Stage Object Detection

文章目录 FCOS: Fully Convolutional One-Stage Object DetectionAbstract1. Introduction2. Related Work3. Our Approach3.1. Fully Convolutional One-Stage Object Detector3.2. Multi-level Prediction with FPN for FCOS3.3. Center-ness for FCOS 4. Experiments4.1. Ab…

阅读更多...

字符串匹配的Rabin–Karp算法

字符串匹配的Rabin–Karp算法

leetcode-28 实现strStr() 更熟悉的字符串匹配算法可能是KMP算法, 但在Golang中,使用的是Rabin–Karp算法一般中文译作拉宾-卡普算法,由迈克尔拉宾与理查德卡普于1987年提出 “ 要在一段文本中找出单个模式串的一个匹配，此算法具有线性时间的平均复杂度&#xff0…

阅读更多...

Elasticsearch 高级搜索技巧和最佳实践

Elasticsearch 高级搜索技巧和最佳实践

Elasticsearch 高级搜索技巧和最佳实践 Elasticsearch 是一个开源的分布式搜索和分析引擎，它支持实时地存储、搜索和分析大规模数据。它被广泛应用于各行各业，用于构建高性能的搜索引擎、日志分析系统、电子商务推荐系统等。本文将介…

阅读更多...

【LeetCode-中等题】230. 二叉搜索树中第K小的元素

【LeetCode-中等题】230. 二叉搜索树中第K小的元素

文章目录题目方法一：层序遍历集合排序方法二：中序遍历（栈或者递归 ）方法三（方法二改进）：中序遍历（栈 ） 题目该题最大的特点就是这个树是二叉树： 所以…

阅读更多...

【java中的Set集合】HashSet、LinkedHashSet、TreeSet（最通俗易懂版！！）

【java中的Set集合】HashSet、LinkedHashSet、TreeSet（最通俗易懂版！！）

目录一、HashSet集合 1.HashSet集合的特点 2.HashSet常用方法二、LinkedHashSet集合 LinkedHashSet集合的特点三、TreeSet集合 1.TreeSet集合的特点 2.TreeSet的基本使用四、HashSet、LinkedHashSet、TreeSet的使用场景五、list和set集合的区别一、HashSet集合 …

阅读更多...

go中的函数

go中的函数

demo1:函数的几种定义方式 package mainimport ("errors""fmt" )/* 函数的用法跟其他语言的区别：支持多个返回值*///函数定义方法1 func add(a, b int) int {return a b }//函数定义方法2 func add2(a, b int) (sun int) {sun a breturn s…

阅读更多...

最新文章