TM-align蛋白质聚类数据格式转化

TM-align 对蛋白质结构中的序列进行同源性聚类分析的结果格式如下:

8p0k_H	8p0k_H
8p0k_H	8p0n_H
8p0k_H	8p0j_H
8p0v_M	8p0v_M
8p0y_O	8p0y_O
8p0y_O	8p10_O
8p0y_O	8p0y_A
8p0y_O	8p10_D
8p0y_O	8p24_V
8p0y_O	8p24_Z

其中,第一列为聚类的代表序列,第二列为这一聚类的同源序列

把这个格式转换成csv文件:

第一列为编号,第二列为聚类的代表序列,第三列为所有的其它同源序列,逗号隔开。

如:

IDX   CLUSTER   HOMOLOG1     8p0k_H    "8p0n_H,8p0j_H"

代码:

import csv
from collections import defaultdict# 初始化字典存储代表序列及其同源序列
clusters = defaultdict(list)# 从文件中读取数据
with open('result.tsv', 'r') as file:for line in file:rep, seq = line.strip().split()  # 去除换行符并按制表符分割if rep != seq:  # 只保留同源序列,去掉代表序列clusters[rep].append(seq)# 将结果写入CSV
with open('clusters.csv', 'w', newline='') as csvfile:writer = csv.writer(csvfile)writer.writerow(['IDX', 'CLUSTER', 'HOMOLOG'])for idx, (rep, seqs) in enumerate(clusters.items(), 1):writer.writerow([idx, rep, ','.join(seqs)])print("CSV文件已生成")

可以进一步把不符合要求的结构过滤掉,从而得到的数据集可以用于结构预测或蛋白质设计的模型研究。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/54578.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

思科安全网络解决方案

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 《Java代码审…

【门牌制作 / A】

题目 代码 #include <bits/stdc.h> using namespace std; int main() {int cnt 0;for (int i 1; i < 2020; i){string s;s to_string(i);cnt count(s.begin(), s.end(), 2);}cout << cnt; }

【C++篇】走进C++标准模板库:STL的奥秘与编程效率提升之道

文章目录 C STL 初探&#xff1a;打开标准模板库的大门前言第一章: 什么是STL&#xff1f;1.1 标准模板库简介1.2 STL的历史背景1.3 STL的组成 第二章: STL的版本与演进2.1 不同的STL版本2.2 STL的影响与重要性 第三章: 为什么学习 STL&#xff1f;3.1 从手动编写到标准化解决方…

【论文速看】DL最新进展20240923-长尾综述、人脸防伪、图像分割

目录 【长尾学习】【人脸防伪】【图像分割】 【长尾学习】 [2024综述] A Systematic Review on Long-Tailed Learning 论文链接&#xff1a;https://arxiv.org/pdf/2408.00483 长尾数据是一种特殊类型的多类不平衡数据&#xff0c;其中包含大量少数/尾部类别&#xff0c;这些类…

tomcat服务搭建部署ujcms网站

tomcat服务搭建部署ujcms网站 关闭selinux和防火墙 setenforce 0 && systemctl stop firewalld安装java环境 #卸载原有java8环境 yum remove java*#上传java软件包&#xff0c;并解压缩 tar -xf openjdk-11.0.1_linux-x64_bin.tar.gz && mv jdk-11.0.1 jdk11…

docker 镜像,导入导出,

dockers镜像传输&#xff1a;docker save和docker load命令的使用_docker save -o-CSDN博客 docker save 命令 docker load 命令 快速复制容器-CSDN博客 创建docker容器报错:Error response from daemon: No command specified-CSDN博客 Docker 镜像移动或复制到另一台服务器_d…

了解函数式编程:从表象到本质,从技法到心法

今天看到&#xff0c;《代码整洁之道》&#xff08;Clean Code&#xff09;和《架构整洁之道》&#xff08;Clean Architecture&#xff09;的作者Robert C. Martin在讨论函数式编程时曾提到&#xff1a; 函数式编程不仅仅是“用函数编程”。函数式编程是没有赋值语句的编程。 …

TaskRes: Task Residual for Tuning Vision-Language Models

文章汇总 当前VLMs微调中存在的问题 提示微调的问题 在提示调优中缺乏对先验知识保存的保证(me&#xff1a;即提示微调有可能会丢失预训练模型中的通用知识)。虽然预先训练的文本分支模块(如文本编码器和投影)的权重在提示调优范式中被冻结&#xff0c;但原始的良好学习的分类…

BUUCTF-MISC-荷兰宽带数据泄露

下载附件得到一个二进制文件 通过题目猜测这是一段路由器备份日志&#xff0c;可以使用RouterPassView打开 链接: https://pan.baidu.com/s/1tY5Sdl8GcI5dKQdhPXj5yA?pwdhi9k 下载链接http://pan.baidu.com/s/1tY5Sdl8GcI5dKQdhPXj5yA?pwdhi9k注意&#xff0c;这个软件会报毒…

ARPGDemo第一阶段

1、阶段展示 ARPGDemo阶段展示1 2、使用技术 1.资源使用 开发阶段使用AssetDatabase.LoadAssetAtPath在Editor加载使用&#xff0c;当需要导包将切换AssetBundles来Build并使用加载。 2.加载详情 项目中开始界面UI以及场景的加载均使用异步加载。其中场景切换异步加入了异步…

struts2 S2-057远程执行代码漏洞 靶场攻略

环境 vulhub靶场 /struts2/s2-057 漏洞简介 漏洞产⽣于⽹站配置XML时如果没有设置namespace的值&#xff0c;并且上层动作配置中并没有设置 或使⽤通配符namespace时&#xff0c;可能会导致远程代码执⾏漏洞的发⽣。同样也可能因为url标签没 有设置value和action的值&…

react + antDesign封装图片预览组件(支持多张图片)

需求场景&#xff1a;最近在开发后台系统时经常遇到图片预览问题&#xff0c;如果一个一个的引用antDesign的图片预览组件就有点繁琐了&#xff0c;于是在antDesign图片预览组件的基础上二次封装了一下&#xff0c;避免重复无用代码的出现 效果 公共预览组件代码 import React…

JBoss EJBInvokerServlet CVE-2013-4810 反序列化漏洞

vulhub/jboss/JMXInvokerServlet-deserialization 1. 此漏洞存在于JBoss中 /invoker/JMXInvokerServlet 路径。访问若提示下载 JMXInvokerServlet&#xff0c;则可能存在漏洞&#xff1a; #创建class⽂件 javac -cp .:commons-collections-3.2.1.jar ReverseShellCommonsCol…

SpringBoot开发——整合Apache POI轻松生成精美的Excel报表

文章目录 1、准备工作2、编写代码2.1 创建实体类2.2 创建Excel生成服务2.3 创建控制器 3、测试4、结论 在许多企业应用程序中&#xff0c;导出数据到Excel表格是一项常见的需求。Spring Boot提供了许多库来简化这个过程&#xff0c;其中包括Apache POI和Spring Boot的相关模块。…

格力嵌入式面试题及参考答案

break 和 return 的区别 break 和 return 在编程语言中都用于控制程序的流程,但它们有很大的区别。 break 主要用于循环语句(如 for 循环、while 循环)和 switch 语句中。在循环中,当遇到 break 语句时,立即终止当前循环,程序将从循环后的下一条语句继续执行。例如在一个…

Qt 模型视图(四):代理类QAbstractItemDelegate

文章目录 Qt 模型视图(四):代理类QAbstractItemDelegate1.基本概念1.1.使用现有代理1.2.一个简单的代理 2.提供编辑器3.向模型提交数据4.更新编辑器的几何图形5.编辑提示 Qt 模型视图(四):代理类QAbstractItemDelegate ​ 模型/视图结构是一种将数据存储和界面展示分离的编程方…

Python国产新 ORM 框架 fastzdp_sqlmodel 快速入门教程

创建模型 from typing import Optional from sqlmodel import Field, SQLModel import fastzdp_sqlmodel as fasmclass Hero(SQLModel, tableTrue):id: Optional[int] Field(defaultNone, primary_keyTrue)name: strsecret_name: strage: Optional[int] None创建表 from ty…

系统架构设计师:软件可靠性

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师:软件可靠性前言软件可靠性可靠性的目标可以用如下方面来描述可靠性测…

IO流笔记

Java中的IO操作大体能分成两种&#xff1a;输出流和输入流&#xff0c;根据使用的流的方式&#xff0c;又可分为字符流和字节流。 1.读数据流 Reader和InputStream&#xff0c;它们都是抽象类&#xff0c;必须由其子类实例化。 实例化&#xff1a;FileReader和FileInputStream&…

【C语言零基础入门篇 - 7】:拆解函数的奥秘:定义、声明、变量,传递须知,嵌套玩转,递归惊艳

文章目录 函数函数的定义与声明局部变量和全局变量、静态变量静态变量和动态变量函数的值传递函数参数的地址传值 函数的嵌套使用函数的递归调用 函数 函数的定义与声明 函数的概念&#xff1a;函数是C语言项目的基本组成单位。实现一个功能可以封装一个函数来实现。定义函数的…