PSI-BLAST位点特异性矩阵PSSM和ProteinMPNN中氨基酸顺序映射

先创建一个 permutation_matrix,以便将PSI-BLAST输出结果PSSM文件中 input_alphabet 中的氨基酸顺序映射到 mpnn_alphabet 中。然后使用这个矩阵将 来自PSI-BLAST的pssm_log_odds 中的数据重新排列,以匹配 mpnn_alphabet 的顺序。

源代码:

import numpy as npmpnn_alphabet = 'ACDEFGHIKLMNPQRSTVWYX'
input_alphabet = 'ARNDCQEGHILKMFPSTWYV'permutation_matrix = np.zeros([20,21])
for i in range(20):letter1 = input_alphabet[i]for j in range(21):letter2 = mpnn_alphabet[j]if letter1 == letter2:permutation_matrix[i,j]=1.pssm_log_odds = np_lines[:,:20] @ permutation_matrix
pssm_probs = np_lines[:,20:40] @ permutation_matrix# np_lines[:,:20]  20种氨基酸(input_alphabet顺序)pssm_log_odds
# np_lines[:,20:40]  20种氨基酸(input_alphabet顺序)观测频率

关于置换矩阵permutation_matrix

permutation_matrix 是一种矩阵,用于将数据从一种排列映射或转换为另一种排列。在生物信息学、机器学习等领域,当需要对数据或标签进行重新排序以匹配不同的序列或标签集时,它非常有用。

什么是 permutation_matrix

permutation_matrix 是一个稀疏矩阵,其中每一行和每一列通常只有一个元素为 1,其他元素为 0。该矩阵的作用是将一个向量或矩阵的元素按照预定的规则重新排列。例如,如果有一个数据集按字母表 A 排序,而模型要求数据按照字母表 B 排序,则 permutation_matrix 可以实现将 A 转换成 B 的映射。

应用场景
  1. 序列映射
    在生物信息学中,氨基酸字母表或基因数据的排列顺序可能在不同的数据源或算法中存在差异。使用 permutation_matrix 可以将这些数据源之间的排列统一,以便在同一分析中一致处理。例如,将 input_alphabet 的排列映射到 mpnn_alphabet

  2. 多分类问题中的标签映射
    在机器学习中,训练数据的标签顺序可能与模型预期的标签顺序不同。permutation_matrix 可以重新排列预测结果的顺序,使其与实际标签匹配。这在图像分类、多标签分类等领域很有用。

  3. 线性代数运算
    在矩阵乘法中,permutation_matrix 可以有效地交换矩阵的行或列。例如,可以对矩阵的行或列重新排序,或调整多维数据的轴排列顺序。

  4. 图神经网络中的节点排列
    在图神经网络中,不同的数据集可能对节点进行不同的编号。permutation_matrix 可以将不同编号系统之间的节点编号统一,从而实现一致的数据处理和训练。

例子

假设你有一个排列 A = [a, b, c],需要将其映射为 B = [c, a, b]。那么 permutation_matrix 可以表示为:

A = np.array([1, 2, 3])  # 原排列
permutation_matrix = np.array([[0, 1, 0],  # a 映射到位置 2[0, 0, 1],  # b 映射到位置 3[1, 0, 0],  # c 映射到位置 1
])
B = A @ permutation_matrix  # 结果 B = [3, 1, 2]

通过这种方式,permutation_matrix 可以实现不同排列的高效映射操作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/58645.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

台式电脑如何改ip地址:全面解析与实操指南

有时候,由于IP地址冲突、网络安全、隐私保护或特定应用需求,我们可能需要更改台式电脑的IP地址。然而,对于不熟悉网络设置的用户来说,这一过程可能显得复杂而陌生。本文将通过全面解析与实操指南,帮助大家轻松掌握台式…

【私聊记录】最近在忙什么啊?听说你在学人工智能?

小舒:哎,你最近在忙什么啊? 小元:我在学习人工智能呢。 小舒:人工智能?难不难学啊? 小元:不难,找到正确的学习姿势就不难了! 小舒:那你为什么想学…

电动越野车行业全面深入分析

电动越野摩托车是将电动技术与越野性能相结合的一类摩托车,采用电力驱动,具有环保、节能、低噪音等优点,同时保留了越野摩托车的强劲动力和适应复杂地形的能力。电动越野摩托车通常配备高性能电动机和电池组,可提供强劲的动力输出…

ctfshow--xss靶场web327-web333(一命速通不了的靶场)

前言 欢迎来到我的博客 个人主页:北岭敲键盘的荒漠猫-CSDN博客 web327 打开页面是一个写信页面。 这里题目暗示不明显。 这里是要给admin写信&#xff0c;让他触发我们的xss。(不看解析不知道有个admin用户) payload: <svg οnlοadwindow.location.hrefhttp://xss平台地址…

法律文件智能识别:免费OCR平台优化数字化管理

一、系统概述 在法律行业&#xff0c;纸质文件的数字化需求日益迫切&#xff0c;合同、判决书、协议等文件的管理成为法律部门的一大难题。传统手动输入不仅耗时&#xff0c;且易出错。思通数科的OCR识别平台应运而生&#xff0c;以其开源、免费的特性为法律文档管理提供了智能…

Flutter-Engine 的定制实践:Text 绘制流程浅析及自定义underline的间距

前言 最近工作中处理的文本相关的内容较多&#xff0c;不论是刁钻的需求还是复杂的问题&#xff0c;最终都会引向一点“Flutter中的文本是如何绘制的&#xff1f;”。 这里我将以“调整下划线与文字的间距”为切入点并结合自定义Engine&#xff0c;记录一下我的个人分析和实践…

考前必看!软考机考论文相关问题解答

机考用的是什么输入法&#xff1f; 答&#xff1a;参考其他机考考试&#xff0c;支持5种输入法&#xff1a;微软拼音输入法、谷歌拼音输入法、搜狗拼音输入法、极品五笔输入法、万能五笔输入法。 打字比较慢的怎么办&#xff1f; 答&#xff1a;如果论文和案例均需输入文字作…

“基金申请精要:国自然基金撰写与SCI发表“

国自然基金项目撰写技巧与ChatGPT融合应用 随着社会经济发展和科技进步&#xff0c;基金项目对创新性的要求越来越高。国家级和省级等各类项目的申请层出不穷&#xff0c;项目书的撰写几乎占据了申请人的全年时间。申请人既需要提出独特且有前瞻性的研究问题&#xff0c;具备突…

极狐GitLab签约某高端纯电头部车企,助力车企打造智能汽车“软件工厂”

客户背景 该客户是国产高端智能电动汽车头部企业&#xff0c;成立于 2021年3月。自成立以来&#xff0c;该客户就一直聚焦在豪华纯电动汽车领域&#xff0c;致力于推动豪华纯电动汽车技术的进步和市场的发展。短短三年时间推出了多款备受市场青睐的高端纯电车型。凭借着在技术…

宠物自动喂食器方案芯片

宠物在现代人的生活中占有极大的比重&#xff0c;甚至愿意将宠物当做孩子精细地养活。也正因为如此&#xff0c;由宠物而衍生出来的产业链涉及方方面面&#xff0c;不但解决了宠物主人的烦恼&#xff0c;也给宠物们带来更为幸福的生活。其中&#xff0c;宠物自动喂食器就解决了…

java的依赖注入

java的依赖注入是个什么东西&#xff1f; 计算机专业相关知识2024-08-07 17:26河北 摘要 •帮你速读文章内容 java中的依赖注入&#xff08;Dependency Injection, DI&#xff09;是一种软件设计模式&#xff0c;用于减少代码间的耦合度。它允许一个对象&#xff08;被依赖的…

别再为质量问题头疼了,六西格玛黑带培训来救场!

六西格玛&#xff0c;这一源自摩托罗拉的先进质量管理理念&#xff0c;以其严谨的数据分析、持续的流程改进和追求卓越的核心价值&#xff0c;在全球范围内赢得了广泛的认可与应用。而六西格玛黑带&#xff0c;作为这一体系中的精英&#xff0c;不仅掌握了深厚的统计学知识&…

visual studio使用注意

一.每一个项目源文件的开头都要加一个define&#xff0c;这将禁用对不安全函数的警告。 #define _CRT_SECURE_NO_WARNINGS或者将 scanf 改为 scanf_s&#xff0c;并按照其要求提供额外的参数。 二.可以在SLN解决方案建多个项目&#xff0c;每一个项目都只能放一个文件。因为每…

深度学习基础知识-Batch Normalization(BN)超详细解析

一、背景和问题定义 在深层神经网络&#xff08;Deep Neural Networks, DNNs&#xff09;中&#xff0c;层与层之间的输入分布会随着参数更新不断发生变化&#xff0c;这种现象被称为内部协变量偏移&#xff08;Internal Covariate Shift&#xff09;。具体来说&#xff0c;由…

优雅的LUA数据记录方法-serpent序列化+LUA Table

目录 简述如何集成&#xff1f;如何使用序列化 反序列化 参考 简述 项目里需要使用LUA脚本将数据记录到文件&#xff0c;要方便的增加、查找、删除&#xff0c;要方便的加载与存回。 使用序列化/反序列化 lua table可以很容易实现这些功能。 序列化将table转换为字符串 反序列…

2024双11海外购物新选择,逆向代购商家的营销利器

各大电商平台早已蓄势待发&#xff0c;迎接双11这场年度消费盛宴。与往年相比&#xff0c;今年的双11筹备工作启动得更早&#xff0c;国庆假期刚一结束&#xff0c;各大平台便进入了紧张的筹备阶段。对于遍布全球的海外购物者而言&#xff0c;无论是热衷于探索中国文化的外国人…

Cyber​​Panel upgrademysqlstatus 远程命令执行漏洞(QVD-2024-44346)

0x01 产品简介 CyberPanel是一个开源的Web控制面板,它提供了一个用户友好的界面,用于管理网站、电子邮件、数据库、FTP账户等。CyberPanel旨在简化网站管理任务,使非技术用户也能轻松管理自己的在线资源。 0x02 漏洞概述 该漏洞源于upgrademysqlstatus接口未做身份验证和…

【万户软件-注册安全分析报告-无验证方式导致安全隐患】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 1. 暴力破解密码&#xff0c;造成用户信息泄露 2. 短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉 3. 带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造…

大舍传媒:海外发稿传统新闻媒体发布新闻稿与门户媒体宣发的区别?

大舍传媒&#xff1a;海外发稿传统新闻媒体发布新闻稿与门户媒体宣发的区别&#xff1f; 在当今全球化的信息时代&#xff0c;新闻报道的传播渠道日益多元化&#xff0c;企业和个人在进行海外发稿时&#xff0c;往往面临着在传统新闻媒体和门户媒体之间的选择。那么&#xff0…