论文阅读:基于隐马尔可夫模型的蛋白质多序列比对方法研究

本文来自chatpaper

Basic Information:
• Title: Research on Protein Multiple Sequence Alignment Method Based on Hidden Markov Model (基于隐马尔可夫模型的蛋白质多序列比对方法研究)
• Authors: Zhan Qing
• Affiliation: Harbin Institute of Technology (哈尔滨工业大学)
• Keywords: protein multiple sequence alignment, hidden Markov model, optimization, residue substitution scoring, guide tree construction, refinement
论文简要 :
• 本研究基于隐马尔可夫模型,针对蛋白质多序列比对问题进行了研究,提出了一种优化的残基替换计分方法,并结合优化算法和配分函数计算后验概率,通过渐进式多序列比对得到较优的比对结果。
背景信息:
• 论文背景: 生物序列的相似性对于生物功能的理解非常重要,而多序列比对是发现序列相似性的常用方法之一。然而,多序列比对问题是一个NP问题,无法通过标准的动态规划算法得到最优解。因此,研究人员一直在寻找近似算法来解决这个问题。
• 过去方案: 过去的研究中,渐进式多序列比对是应用最广泛的一类近似算法。该算法通过序列之间的两两比对确定距离矩阵,并根据距离矩阵构建指导树,然后逐步构建多序列比对。然而,现有的多序列比对方法在残基的替换计分、指导树的构建和比对结果的精化等方面存在问题。
• 论文的Motivation: 针对现有多序列比对方法的问题,本研究提出了一种基于隐马尔可夫模型的蛋白质多序列比对方法。该方法通过优化残基替换计分方法,结合优化算法和配分函数计算后验概率,以得到更准确的比对结果。通过这种方法,可以提高蛋白质二级结构预测、系统发生树重建和功能推断等分析的准确性和可靠性。
方法:
• a. 理论背景:
o 本博士论文侧重于基于隐马尔可夫模型的蛋白质多序列比对方法的研究。生物序列的相似性反映了生物功能的相似性以及序列之间和共同祖先之间的遗传差异。多序列比对在生物学中被广泛应用于识别不同序列之间的同源位置。它是一种重要的建模方法,帮助生物学家区分序列中的相关区域,对于蛋白质二级结构预测、系统发育树重建和通过蛋白质域比较进行功能推断具有重要意义。本研究解决了多序列比对的问题,这是一个NP问题,无法通过标准的动态规划算法进行最优求解。渐进式多序列比对是最常用的近似算法类别,它首先通过成对比对确定序列之间的距离矩阵,然后基于距离矩阵构建导引树。最后,根据导引树中的进化距离逐步构建多序列比对,并通过迭代改进比对结果以获得最优结果。总体而言,这种类型的近似算法通过逐步比对序列或序列谱将多序列比对问题转化为顺序成对比对问题,从而找到问题的近似解。本论文解决了现有多序列比对方法研究中的几个问题,包括残基替代评分、导引树构建和比对结果的改进。
• b. 技术路线:
o 本文提出了一种基于隐马尔可夫模型优化和组合的残基替代评分方法。该方法在成对比对的动态规划中使用残基对的后验概率作为替代评分。该方法在提高序列比对准确性方面非常有效,特别适用于低同源性的蛋白质家族。
o 本文引入了一种自适应导引树构建方法,根据蛋白质序列之间的相似度程度使用不同的隐马尔可夫模型构建导引树,以解决当前固定导引树构建方法的局限性。比对的顺序很重要,所提出的方法改善了比对的准确性,特别适用于低同源性的蛋白质家族。
o 此外,本文提出了一种基于垂直分割的重新比对改进方法,解决了当前只考虑水平分割的方法的局限性。实验结果表明,该方法提高了比对结果的准确性,特别适用于具有长氨基/羧基端延伸的蛋白质家族。
o 最后,本文提出了一种综合融合的多序列比对方法,根据蛋白质家族的同源性使用不同的模型和技术进行融合。该方法使用粒子群优化、隐马尔可夫模型和分区函数模型处理低同源性的家族,使用局部和全局隐马尔可夫模型处理高同源性的家族。然后,使用基于垂直分割的重新比对改进方法对比对结果进行改进。实验结果表明,该综合融合方法全面提高了序列比对的准确性,并为下游生物学分析提供了更可靠的基础。
结果:
• a. 详细的实验设置:
o 本文的实验设置包括使用不同的蛋白质家族数据集进行测试,比较不同方法的性能。对于残基替代评分方法,使用隐马尔可夫模型优化和组合的方法进行评估。对于导引树构建方法,使用不同的隐马尔可夫模型根据蛋白质序列的相似度构建导引树。对于重新比对改进方法,使用具有长氨基/羧基端延伸的蛋白质家族进行测试。最后,使用综合融合的多序列比对方法对不同同源性的蛋白质家族进行比对,并使用基于垂直分割的重新比对改进方法对比对结果进行改进。
• b. 详细的实验结果:
o 实验结果表明,本文提出的残基替代评分方法在提高序列比对准确性方面非常有效,特别适用于低同源性的蛋白质家族。自适应导引树构建方法改善了比对的准确性,特别适用于低同源性的蛋白质家族。基于垂直分割的重新比对改进方法提高了比对结果的准确性,特别适用于具有长氨基/羧基端延伸的蛋白质家族。综合融合的多序列比对方法全面提高了序列比对的准确性,并为下游生物学分析提供了更可靠的基础。

论文原址:http://cdmd.cnki.com.cn/Article/CDMD-10213-1020401233.htm
参考:https://chatwithpaper.org/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/89617.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件测试自动化的成本效益分析

随着软件测试技术的发展,人们已经从最初的手工测试转变为手工和自动化技术相结合的测试方法。目前,人们更多的是关心自动化测试框架、自动化测试工具以及脚本研究等技术方面,而在软件自动化测试方案的效益分析方面涉及较少。 软件测试的目的是…

ElasticSearch(二)

1.DSL查询文档 elasticsearch的查询依然是基于JSON风格的DSL来实现的。 1.1.DSL查询分类 Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。常见的查询类型包括: 查询所有:查询出所有数据,…

钢轨长度及允许偏差

声明 本文是学习GB-T 2585-2021 铁路用热轧钢轨. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 1 范围 本标准规定了铁路用钢轨的订货内容、分类、尺寸、外形、质量及允许偏差、技术要求、试验方法、检 验规则、标志及质量证明书。 本标准适用于3…

MySQL ——多表连接查询

一、(左、右和全)连接概念 内连接: 假设A和B表进行连接,使用内连接的话,凡是A表和B表能够匹配上的记录查询出来。A和B两张表没有主付之分,两张表是平等的。 关键字:inner join on 语句&#xf…

css实现Chrome标签栏

如图这是一个特殊的带有圆角的导航栏&#xff0c;实现这种效果并不难 这是我实现的效果&#xff1a; 淡一点的就是鼠标悬停的样式 以下是代码&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><m…

分类预测 | MATLAB实现SSA-FS-SVM麻雀算法同步优化特征选择结合支持向量机分类预测

分类预测 | MATLAB实现SSA-FS-SVM麻雀算法同步优化特征选择结合支持向量机分类预测 目录 分类预测 | MATLAB实现SSA-FS-SVM麻雀算法同步优化特征选择结合支持向量机分类预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 MATLAB实现SSA-FS-SVM麻雀算法同步优化特征选择结…

使用 PyTorch 的计算机视觉简介 (3/6)

一、说明 在本单元中&#xff0c;我们将了解卷积神经网络&#xff08;CNN&#xff09;&#xff0c;它是专门为计算机视觉设计的。 卷积层允许我们从图像中提取某些图像模式&#xff0c;以便最终分类器基于这些特征。 二、卷积神经网络 计算机视觉不同于通用分类&#xff0c;因…

echarts 地图 visualMap 图例点击事件监听

一、切换位置 二、切换监听 // 切换事件监听 this.myChart.off(datarangeselected); // 为了不触发两次 this.myChart.on(datarangeselected,(e) > {// visualMap change });// 配置如下 visualMap: {type: piecewise,showLabel: true,inverse: true,pieces: [{value: 1,…

为什么大力推行国密算法SSL证书

国密算法SSL证书是一种采用我国自主研发的SM2公钥算法体系&#xff0c;支持SM2、SM3、SM4等国产密码算法及国密SSL安全协议的数字证书。相比于普通SSL证书&#xff0c;国密SSL证书具有以下特点&#xff1a; 自主可控&#xff1a;国密SSL证书采用我国自主研发的SM2公钥算法体系&…

STM32实现PMBus从机程序

最近在野火的STM32F103VET6开发板上实现PMBus从机程序&#xff0c;这个程序参考了以下这篇博客的关于使用中断法实现I2C从机程序&#xff1a;STM32设置为I2C从机模式_iic从机_柒壹漆的博客-CSDN博客 &#xff0c;实测这个程序是可以正常运行的&#xff0c;感谢博主的分享&#…

MySQL 5与MySQL 8版本差异及MySQL 8的新功能

MySQL 5与MySQL 8版本差异及MySQL 8的新功能 在数据库管理系统中&#xff0c;MySQL是一个广泛使用、开源的解决方案。它提供了强大的功能&#xff0c;同时具有优秀的性能和可扩展性。到目前为止&#xff0c;MySQL经历了两个重要的版本升级&#xff0c;从MySQL 5到MySQL 8。这两…

对标8155体验,降本20%以上!这家企业用“量产”证明

智能座舱逐渐成为智能汽车标配。 根据高工智能汽车研究院监测的数据显示&#xff0c;2022年中国市场&#xff08;不含进出口&#xff09;乘用车搭载智能数字座舱&#xff08;大屏语音车联网OTA&#xff09;前装标配交付795.05万辆&#xff0c;同比增长40.59%&#xff0c;前装搭…

Python 笔记02 (网络交互 TCP/UDP)

一 socket网络及差别介绍 TCP&#xff08;传输控制协议&#xff09;和UDP&#xff08;用户数据报协议&#xff09;是两种常见的互联网传输协议&#xff0c;它们之间有很多区别&#xff0c;包括以下几个主要方面&#xff1a; 1.1 TCP TCP是传输控制协议&#xff0c;是面向连接…

解决docker容器无法关闭的问题

一般正常关闭&#xff1a; docker stop 容器ID解决方法 方法1&#xff1a;强制停止docker kill 容器ID方法2&#xff1a;直接重启dockersudo service docker stop方法3&#xff1a;直接删除容器&#xff0c;重新创建docker rm -f my_container

[python 刷题] 84 Largest Rectangle in Histogram

[python 刷题] 84 Largest Rectangle in Histogram 题目&#xff1a; Given an array of integers heights representing the histogram’s bar height where the width of each bar is 1, return the area of the largest rectangle in the histogram. 这题也是一个典型的 mo…

微调大型语言模型(一):为什么要微调(Why finetune)?

今天我们来学习Deeplearning.ai的在线课程 微调大型语言模型(一)的第一课&#xff1a;为什么要微调(Why finetune)。 我们知道像GPT-3.5这样的大型语言模型(LLM)它所学到的知识截止到2021年9月&#xff0c;那么如果我们向ChatGPT询问2022年以后发生的事情&#xff0c;它可能会…

diff算法面试题

面试题&#xff1a;请阐述vue的diff算法 参考回答&#xff1a; 当组件创建和更新时&#xff0c;vue均会执行内部的update函数&#xff0c;该函数使用render函数生成的虚拟dom树&#xff0c;将新旧两树进行对比&#xff0c;找到差异点&#xff0c;最终更新到真实dom 对比差异的过…

轻松上手Docker:学习如何创建和运行自己的Docker容器

文章目录 轻松上手Docker&#xff1a;学习如何创建和运行自己的Docker容器容器的介绍Docker的技术架构容器的工作机制&#xff08;Docker&#xff09;容器的关键技术 - NamespaceNamespace隔离说明 容器的关键技术 - CgroupDocker环境搭建1&#xff09;安装基础软件包2&#xf…

【0222】存储管理器smgr设计机制,及SMgrRelation、SMgrRelationData的作用(1)

1. 概述 在【0000】PostgreSQL源码剖析教程专栏总目录(2023.09.06更新) 一文的“3.4 VFD机制”章节中,详细讲解了PG内核中VFD(虚拟文件描述符)的实现原理。 本文开始,将来讲解PG内核中另外一个非常重要的知识点,即PG内核的存储管理器 ----- 磁盘介质管理器(SMGR)。 这…

python安全工具开发笔记(四)——python网络编程

一、C/S架构 什么是C/S架构 C : Client S : Server。客户机和服务器结构。 Server 唯一的目的就是等待Client 的请求&#xff0c;Client 连上 Server 发送必要的数据&#xff0c;然后等待Server端完成请求的反馈。 C/S网络编程 Server端进行设置&#xff0c;首先创建一个通信…