学习笔记Day12:初探LInux 2

Linux初探

同一个目录中不允许出现文件及文件夹重名

查看文件
  1. cat (Concatenate)查看文本文件内容,输出到屏幕(标准输出流)

    • 常用参数

      • -A打印所有字符,包括特殊字符(换行符、制表符等)
      • -n/-b标记行号,-n标记空行,-b不标记空行
    • 常见用法

      cat > file创建一个新文件file,并可以将简单内容写入文件。

      >为重定向符,意为把cat原本输出到屏幕的内容写入file的文件,会覆盖。

      >>追加符,可以继续写入文件,不覆盖。

      zcat可以读压缩文件

    tac倒着看文件(从倒数第一行开始输出)

  2. head 查看文件的前n行(默认10行)

    tail查看文件的后n行(默认10行)

    • 常用参数

      • -n设置看多少行的参数
    • 常见用法

      cat file.txt | head -n3 等价 head -n3 file.txt

      |管道符号

  3. more逐页查看文件,按空格翻页,按回车换行,q退出

    less more的升级版,常用的查看文件命令

    • 常见参数

      • -N 显示行号
      • -S 单行显示(可以上下左右翻阅)
    • 常见用法

      /keyword进行关键词搜索;n/N上下跳转关键词。

  4. wcword count)统计文本

    • 常见参数

      • -l 统计行数(比较常用)
      • -w 统计字符串数,连在一起的字母是一个字符串。
      • -c 统计字节数,包括特殊字符,如换行符和制表符等。
    • 常见用法

      wc -l file1.txt file2.txt file3.txt 输出三个文件行数及总计行数

  5. cut 文本分割

    • 常见参数:

      • -d 指定分隔符,默认\t;
      • -f输出哪几列(字段fields)
    • 常见用法:

      less -SN Data/example.gtf | cut -f 1,3-5 | less 以默认制表符分割成列,取出1,3,4,5列(不会乱序)

  6. sort 排序

    • 常见参数:

      • -n 按照数值从小到大排序(默认是按照字符串理解数字的)
      • -V 字符串中含数值时,按照数值从小到大排序
      • -r 逆向排序
      • -k 按照哪一列进行排序
      • -t 指定分隔符
    • 常见用法

      less exp.csv | sort -k 3 -n| less -SN 根据第3列按照数值排序

  7. uniq 去除重复行,只能去除上下挨着的重复行,需要结合sort使用

    • 常见参数

      • -C 统计每个字符串连续出现的行数
    • 常见用法

      cat file.gtf | cut -f3 | sort | uniq -c 将文件以制表符分割的第三列排序后统计出现了多少次(联想R的table)

  8. paste 文本合并

    • 常见参数
      • -d 指定分隔符
      • -s 按行合并
    • 常见用法
      • paste file1 file2 默认按列合并
      • seq 20 | paste - - 很有意思!试一下!
  9. tr 字符替换

    • 常见参数

      • -d 删除
      • -s 缩减连续重复字符
    • 常见用法

      tr 'a' 'A' 把小写a换成大写A,全部替换

      tr ' ' '\t'把空格替换成制表符

      tr '\n' ' '把换行符替换成空格

MD5
  1. 生成md5值:md5sum file1

  2. 验证md5值:md5sum -c file1.md5

小TIPs
  • 特殊符号:^I\t 制表符;$\n 换行符
  • 把输入文件当作输出文件!会清空文件!需要存为另一个文件

生物信息学常见数据格式

fasta (fasta,fa,fna,faa,fas)

基于文本表示核酸序列的

特征:两部分, id行和序列行

  1. id行:以">"开头,有时候会包含注释信息,如chr1、chr2
  2. 序列行:一个字母表示一个碱基/氨基酸,ATCGN或二十种氨基酸
fastq

一种保存生物序列(通常核酸序列)及其测序质量得分信息的文本格式。

特征:四行组成(行内信息必须一行写完)

  1. 第一行:以@开头,之后为序列的标识符以及描述信息
  2. 第二行:为序列信息,如ATCG等
  3. 第三行:以+开头,之后可以再次加上序列的标识及描述信息(可无信息)
  4. 第四行:为碱基质量值,与第二行序列对应,长度相等
gff

在这里插入图片描述

gtf

在这里插入图片描述

  • gene_idtranscript_id非常重要!!

  • 强制对齐column -t

引用自生信技能树课程~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/756262.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

File的学习1

File对象就表示一个路径,可以是文件的路径,也可以是文件夹的路径 这个路径可以是存在的,也可以是不存在的。 package MyFile;import java.io.File;public class FileDemo01 {public static void main(String[] args) {//1.根据文件路径创建…

如何定期清理数据库中的无效数据?

企业的数据库在运行相当长一段时间后,都会出现无效数据的堆积,这些数据包含了过时、重复、错误、缺失(空字段)的数据,长期占据着宝贵的数据库空间。而在上云热潮的推动下,绝大多数企业已经将他们的业务数据…

fastjson反序列化攻略

漏洞原理 Json.parseObject(json, User.class)方法中,通过指定type的值实现定位某类,会执行User类的构造方法和属性中的get,set方法 判断是否是fastjson/(jackson) 1.2.24-1.2.83都会有dnslog的payload {"zer…

Java基础-IO流

文章目录 1.文件1.基本介绍2.常用的文件操作1.创建文件的相关构造器和方法代码实例结果 2.获取文件相关信息代码实例结果 3.目录的删除和文件删除代码实例 2.IO流原理及分类IO流原理IO流分类 3.FileInputStream1.类图2.代码实例3.结果 4.FileOutputStream1.类图2.案例代码实例 …

【Flink】Flink 中的时间和窗口之窗口其他API的使用

1. 窗口的其他API简介 对于一个窗口算子而言,窗口分配器和窗口函数是必不可少的。除此之外,Flink 还提供了其他一些可选的 API,可以更加灵活地控制窗口行为。 1.1 触发器(Trigger) 触发器主要是用来控制窗口什么时候…

【大模型系列】统一图文理解与生成(BLIP/BLIPv2/InstructBLIP)

文章目录 1 BLIP(2022, Salesforce Research)1.1 简介1.2 数据角度1.3 模型角度1.4 BLIP预训练的目标 2 BLIP2(ICML2023, Salesforce)2.1 简介2.2 模型架构2.3 训练细节 3 InstructBLIP(2023, Salesforce)3.1 指令微调技术(Instruction-tuning)3.2 数据集准备3.3 Instruction-a…

docker入门(二)—— docker三大概念(镜像、容器、仓库)

docker 的三大必要概念 docker 的三大必要概念——镜像、容器、仓库 docker 架构图 镜像(image):模版。(web项目:1、环境 2、配置变量 3、上线项目 4、配置项目需要的静态文件)打包成镜像 docker 镜像&a…

代码随想录阅读笔记-哈希表【两个数组的交集】

题目 给定两个数组&#xff0c;编写一个函数来计算它们的交集。 说明&#xff1a; 输出结果中的每个元素一定是唯一的。 我们可以不考虑输出结果的顺序。 提示&#xff1a; 1 < nums1.length, nums2.length < 10000 < nums1[i], nums2[i] < 1000 思路 交集&…

【源码阅读】EVMⅢ

参考[link](https://blog.csdn.net/weixin_43563956/article/details/127725385 大致流程如下&#xff1a; 编写合约 > 生成abi > 解析abi得出指令集 > 指令通过opcode来映射成操作码集 > 生成一个operation 以太坊虚拟机的工作流程&#xff1a; 由solidity语言编…

鸿蒙实战开发:【FaultLoggerd组件】讲解

简介 Faultloggerd部件是OpenHarmony中C/C运行时崩溃临时日志的生成及管理模块。面向基于 Rust 开发的部件&#xff0c;Faultloggerd 提供了Rust Panic故障日志生成能力。系统开发者可以在预设的路径下找到故障日志&#xff0c;定位相关问题。 架构 Native InnerKits 接口 Si…

Linux操作系统——多线程

1.线程特性 1.1线程优点 创建一个新线程的代价要比创建一个新进程小得多与进程之间的切换相比&#xff0c;线程之间的切换需要操作系统做的工作要少很多线程占用的资源要比进程少很多能充分利用多处理器的可并行数量在等待慢速I/O操作结束的同时&#xff0c;程序可执行其他的计…

《1w实盘and大盘基金预测 day7》

昨日预测有点差劲&#xff0c;最低点也相差五个点。 打分C 公众号&#xff1a;JavaHelmet 昨天预测&#xff1a; 3052-3062-3076-3115 3067是趋势线&#xff0c;有回踩需求 5-30-60分钟级别顶钝 大盘冲到标红的点位3115或者3100就需注意。不要随意追高&#xff08;最高309…

备战蓝桥杯---牛客寒假训练营2VP

题挺好的&#xff0c;收获了许多 1.暴力枚举&#xff08;许多巧妙地处理细节方法&#xff09; n是1--9,于是我们可以直接暴力&#xff0c;对于1注意特判开头0但N&#xff01;1&#xff0c;对于情报4&#xff0c;我们可以把a,b,c,d的所有取值枚举一遍&#xff0c;那么如何判断有…

ModbusTCP转Profinet网关高低字节交换切换

背景&#xff1a;在现场设备与设备通迅之间通常涉及到从一种字节序&#xff08;大端或小端&#xff09;转换到另一种字节序。大端字节序是指高位字节存储在高地址处&#xff0c;而小端字节序是指低位字节存储在低地址处。在不动原有程序而又不想或不能添加程序下可选用ModbusTC…

OCP NVME SSD规范解读-13.Self-test自检要求

4.10节Device Self-test Requirements详细描述了数据中心NVMe SSD自检的要求&#xff0c;这一部分规范了设备自身进行各种健康检查和故障检测的过程。自检对于确保SSD的正常运行和提前预防潜在故障至关重要。 在进行设备自检时&#xff0c;设备应当确保不对用户数据造成破坏&am…

【人工智能】Gitee AI 天数智芯有奖体验开源AI模型,一定能有所收货,快来体验吧

大家好&#xff0c;我是全栈小5&#xff0c;欢迎阅读小5的系列文章。 这是《人工智能》系列文章&#xff0c;每篇文章将以博主理解的角度展开讲解。 目录 前言两大赛道天数智芯1.模型地址2.天数智芯专区3.选择模型4.模型详情页5.部署模型6.成功部署7.执行例子8.移除模型 千模盲…

03python注释与输入函数

Python 注释的作用: 注释可用于解释 Python 代码。 注释可用于提高代码的可读性。 在测试代码时,可以使用注释来阻止执行。 注释可以放在一行的末尾,Python 将忽略该行的其余部分: 实例1 print("Hello, World!") #打印输出Hello,World print(9-3) #输出9…

【mybatis】objectwrapper解读

简介 在 MyBatis 中&#xff0c;ObjectWrapper 是一个关键的接口&#xff0c;用于详细封装了对象的属性信息。ObjectWrapper 主要用于内部操作&#xff0c;它抽象了对象的属性操作&#xff0c;使得 MyBatis 能够统一处理原生类型、Bean 对象以及 Map 集合等。 类图展示 主要功…

Vue组件封装方案对比——v-if方式与内置component方式

近期在准备搭建一个通用组件库&#xff0c;而公司现有的各个系统也已有自己的组件库只是没抽离出来&#xff0c;但是目前有两套不同的组件封装方案&#xff0c;所以对于方案的选择比较困惑&#xff0c;于是对两种方式进行了对比&#xff0c;结合网上找到的一些开源组件库进行分…

抖音店铺规划运营管理计划数据分析工作表

【干货资料持续更新&#xff0c;以防走丢】 抖音店铺规划运营管理计划数据分析表 部分资料预览 资料部分是网络整理&#xff0c;仅供学习参考。 抖音小店运营规划工作表格&#xff08;完整资料包含以下内容&#xff09; 目录 1. 抖店运营管理决策表&#xff1a;该表格用于记…