90后斯坦福博士论文登Science封面!AI算法准确预测RNA三维结构

来源:Science

编辑:yaxin、su

「我们对大部分RNA的结构几乎一无所知。」

 

 

半个世纪以来,确定生物分子的三维结构一直困惑着科学家,也是生物学的重大挑战之一。

 

难就难在,RNA折叠成复杂三维结构的形状很难通过实验或计算来确定。

 

而现在,美国斯坦福大学通过新型AI算法准确预测出RNA三维结构,可谓意义重大!

 

今天,Science 封面刊登了这项研究的最新成果,由斯坦福大学在读博士生 Stephan Eismann 和 Raphael Townshend,以及计算机副教授 Ron Dror共同完成。

 

他们利用目前先进的神经网络技术,成功开发出了一种全新 RNA 三维结构预测模型——ARES。

 

从原子入手,机器学习算法预测RNA结构!

RNA 分子和蛋白质一样,会折叠成三维 (3D) 结构,来执行一系列功能,如催化反应、基因表达、调节先天免疫和感知小分子。

 

RNA的三维结构十分重要,有助于理解RNA发挥作用的机制、设计合成 RNA 和发现 RNA 靶向药物。

 


 

人类基因组转录成 RNA 的部分是蛋白质编码的 30 倍左右,然而,我们对RNA结构的认知还远远不够,已知的RNA结构只是蛋白质结构的不到1%。

 

本文的创新之处在于引入了一种新的机器学习方法,开发出一个人工智能模型ARES(Atomic Rotationally Equivariant Scorer)来预测RNA结构,准确率极高!

 

 

而且,研究人员仅用了 18 个已知的 RNA 结构进行训练。

 

 

更厉害的是,ARES无需对RNA的显著特征进行假设,也就是说,它没有关于双螺旋、碱基对、核苷酸或氢键的先入为主的概念。

 

这就使ARES可以适用于任何类型的分子系统!

 

 

ARES包括一组已知 RNA 结构的基序和这些结构的替代(错误)变体。

 

通过调整参数,ARES可以了解每个原子的功能和几何排列,和不同原子间的相对位置。这也是与其他模型不同的一点。

 

然后,神经网络各层可以计算不同粗细尺度的特征,来识别碱基对、RNA螺旋的最佳几何形状、三维空间结构。

 

 

具体来看,ARES网络的初始层旨在识别结构基序(生物大分子中的保守序列),也就是说,基序的特点是在训练过程中学习的,而不是预先设定的。

 

然后,根据前一层的特征和周围原子的几何排列,计算出每一个原子的特征。

 

第一层的唯一输入是每个原子的 3D 坐标和化学元素种类。

 

 

这些初始网络层的架构认识到,给定的结构基序彼此间通常有不同的定位,而且,较粗尺度的基序(如螺旋)通常包括更细尺度的基序(如碱基对)的特定排列。

 

另外,每一层都是旋转和平移等变的,也就是说,输入的旋转或平移在输出时有相应的变换。

 

以上特点可确保将已识别基序的方向和位置传递到ARES网络的下一层,下一层则使用此信息来识别较粗尺度的基序。

 

ARES 还可以预测全局属性,同时详细捕获局部结构基序和原子间相互作用。因为它的初始层在本地收集信息,而其余层则汇总所有原子的信息。

 

测试得出,ARES可以准确识别结构模型。

 

 

对RNA结构做出准确预测。

 

 

作者介绍

文章一作是Raphaël Townshend,1993年生于加拿大蒙特利尔,是斯坦福大学计算机科学博士,目前创办了一家设计新分子和药物的人工智能公司,并担任CEO。

 

个人主页:https://raphael.tc.com/

 

2010-2014年,他曾在加州大学伯克利分校获得电子工程与计算机科学学士学位。

 

Townshend对机器学习、结构生物学、高性能计算、计算机视觉这些领域的研究感兴趣。

 

他曾做过表情识别的一个CV项目。

 

将呈现在受试者脸部的灰度图像中的6种表情分类 (喜悦、悲伤、厌恶、愤怒、惊讶、恐惧)

 

 

他利用 Gabor 滤波器对输入图像进行一对多线性支持向量机训练。

 

并使用了现有的标准数据集,比如,Cohn-Kanade 和 JAFFE,以及自己收集的47个主题的数据集。

 

参考资料:

http://science.sciencemag.org/content/373/6558/1047

http://science.sciencemag.org/content/373/6558/964

https://news.stanford.edu/2021/08/26/ai-algorithm-solves-structural-biology-challenges/

https://twitter.com/raphaeljlt/with_replies

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483985.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Event Recommendation Engine Challenge分步解析第五步

一、请知晓 本文是基于: Event Recommendation Engine Challenge分步解析第一步 Event Recommendation Engine Challenge分步解析第二步 Event Recommendation Engine Challenge分步解析第三步 Event Recommendation Engine Challenge分步解析第四步 需要读者先阅读…

计算机网络之RIP协议与OSPF协议模拟、UDP与TCP编程,Wireshark抓包分析

通过Python模拟RIP协议,OSPF协议,并模拟UDP和TCP编程,并通过Wireshark抓包工具,对所发送的报文进行捕获分析。 文章目录 一、RIP协议的模拟与编程二、OSPF协议的模拟与编程三、UDP编程四、TCP套接字编程五、Wireshark 数据分析六、总结一、RIP协议的模拟与编程 1.1 题目 …

虚拟机 NAT模式与桥接模式的区别

同个人网站 https://www.serendipper-x.cn/,欢迎访问 ! NAT模式:相当于宿主机再构建一个局域网,虚拟机无法和本局域网中的其他真实主机进行通讯。只需要宿主机器能访问互联网,那么虚拟机就能上网,不需要再…

基础研究和前沿技术领域校企融合协同创新的国际经验及启示

来源:中国科学技术发展战略研究院作者:薛姝、何光喜、张文霞原载于《全球科技经济瞭望》2021年5月第5期摘要:促进大学与企业的合作是各个国家科技创新政策和创新体系建设的重点任务,近年来也出现了加强在基础研究和前沿技术领域加…

理解云计算三种服务模式——IaaS、PaaS和SaaS

云计算的服务模式仍在不断进化,但业界普遍接受将云计算按照服务的提供方式划分为三个大类:SaaS(Software as a Service–软件即服务) PaaS(Platform as a Service–平台即服务) IaaS(Infrastruc…

术,路,心:陈天桥的大脑行旅

来源: 脑极体在互联网、云计算与电动汽车之后,连同资本、产业、学术界在内的社会各界,纷纷开始将目光投向更远的地方。下一个超级机会藏在何处?下一个改变人类文明的技术机遇何时触发?随着各国开始在国家战略层面布局下…

8万行的insert数据,Ctrl+c、Ctrl+v后心态崩了(如何在Linux下对MySQL数据库执行sql文件)...

从最下面可以看到,差不多有86389行,Ctrlc、Ctrlv后 PHPstorm一直没有反应。。。。 肿么办??复制粘贴不行的话,可以用什么方法把数据插入到数据库中,数据库用的是MySQL。 皇天不负有心人,卧薪尝胆…

链路状态路由协议与OSPF

链路状态路由算法(LS算法) 工作原理 每个路由器将自己的链路状态信息洪泛到网络上的所有路由器。tips:(每个路由器都洪泛会给网络带来负担)每个路由器最终会知道整个网络的拓扑结构(LSDB)。每个路由器使用…

感知算法、规划地图……波士顿动力揭秘Atlas机器人跑酷背后的技术

来源:机器之心,编辑:nhyilin仅用于学术分享,版权属于原作者几天前,波士顿动力公司放出了双足人形机器人 Atlas 的最新酷炫视频。这次,Atlas 展示了它的最新技能「跑酷」。在一系列倾斜胶合板还有木箱垒成的…

BGP协议

概述 BGP是目前“唯一”的EGP协议,用于AS之间传递路由信息,目前版本为4 为什么需要BGP? 不同AS自治系统的管理部门不同,路由策略不同AS之间的路由不强调最优路径,更强调路由控制和路由策略 IGP与BGP对比 IGP关注如…

Science Robotics:新型多足机器人可自行组装,零件损坏时也能继续运动

来源:DeepTech深科技在自然环境中,群体昆虫(如蜜蜂、蚂蚁、白蚁等)、鱼类和鸟类等动物可以通过合作来完成生物个体难以或不可能完成的任务。受到这些集群行为的启发,许多研究人员研究了自组装或可重构的模块化群机器人…

NAT与DHCP协议

DHCP概述 DHCP产生的原因 大型网络中静态配置IP地址容易出现地址冲突 定义 DHCP:动态主机配置协议,用于主机自动获得IP地址、子网掩码、网关地址、DNS服务器地址,租用期等相关信息。采用C/S模式。DHCP给运行服务器软件、且位置固定的计算机…

OpenGL基础入门及准备

一、计算机图像学相关概念 1.1 计算机图形学,是一种使用数学算法将二维或三维图形转化为计算机显示器所能显示的二维栅格形式的科学。 1.2 屏幕像素组成的网格即称为栅格。 1.3 计算机图形学研究 Modeling:构造场景的三维模型,建模&#…

哈佛商业评论:什么是颠覆性创新?

来源:点滴科技资讯什么是颠覆性创新?在引入该理论 20 年后,我们重新审视了它所解释的和未解释的。本文发表于哈佛商业评论(2015 年 12 月) 作者:克莱顿 M.克里斯滕森, 迈克尔E雷诺,和…

定长掩码地址划分与VLSM子网划分

定长掩码地址划分 案例 若某个公司得到一个C类网络地址210.33.15.0,假如所有子网的掩码都一样,该如何划分子网? 步骤一:确定子网个数 7个子网,其中4个局域网,3个广域网 步骤2:确定每个子网所需…

OpenGL之几何、投影、裁剪、视口变换以及全局变换与局部变换

一、变换的概念 1.1 图形流水线 1.2 变换(Transformation) 变换主要分为四个步骤,主要就是在Vertex operations阶段操作顶点信息,会在流水线中依次进行。 几何变换投影变换裁剪视口变换 三维模型到二维图形的主要变换过程&am…

WinForm中DataGridView的TextBoxColumm换行

一、内容超过显示宽度自动换行: 在需要自动换行的列中设置 二、换行符换行: 一开始在需要换行的文本添加"\r\n"并不能直接换行,DGV直接把\r\n显示出来了,后换成 System.Environment.NewLine 解决问题转载于:https://www…

刷脸背后,卷积神经网络的数学原理原来是这样的

来源:深度学习这件小事计算机视觉技术在日常生活中有着非常普遍的应用:发朋友圈之前自动修图、网上购物时刷脸支付……在这一系列成功的应用背后,卷积神经网络功不可没。本文将介绍卷积神经网络背后的数学原理。在自动驾驶、医疗以及零售这些…

OpenGL之坐标系以及单位

1.1 OpenGL中默认的坐标系为右手坐标系,默认视点位置为原点,原点正好投影在投影窗口的中心,也正好投影在视口的中心。 1.2 在OpenGL中无绝对单位,只有相对的大小,相对于视锥体的大小来设定物体的大小。 1.3 通过估算…

人工智能设计芯片,比你想象的更大胆

来源:ZDNet作者:Tiernan Ray编译:科技行者AI(人工智能)技术正在越来越多地被应用于半导体设计之中,这种做法的优势之一是,人工智能技术会尝试人类想都不敢想的设计方案。例如,对边际…