你真的了解计算生物学和AI for Science吗?

952ed9009ab291ac74c316a4dd4bff02.png

来源:量子位

Q1:AlphaFold2的最大意义是什么?

A1:这个看似突破性的进展,其实是技术演进的必然结果。 

此外,如果我们换个视角来看待这个问题,蛋白质结构预测仅仅是计算生物学这个大门类里面一个相对来说定义得比较清晰(well-defined)的问题。还有很多比蛋白质结构预测更加复杂也更有挑战性的问题,等着我们用人工智能的手段去推进。

Q2:我们认为应该如何去定义计算生物学这一个学科,它里面又会有哪些细分的领域和维度呢? 

A2:研究对象的角度,有宏观的,也有微观的。从微观的角度,可以小到一个蛋白、DNA 或者是一个单细胞。从宏观的角度,可以大到人类或者说生物体的组织、器官、个体甚至是群体。

研究手段来讲,既有传统的生物实验,也有包括计算手段在内的数学建模、数值仿真、数据分析或者是机器学习。 

应用门类来讲,几乎和我们平时生活或者科学发展的方方面面都有关系,它既有在基础科学方面的潜力,也在制药诊疗方面有着巨大价值。

Q3:2021年,微软亚洲研究院首次针对新冠病毒中的 NTD 提出了对应的楔型模型,并鉴定了潜在的药物靶点。能否介绍一下这项工作是怎么基于计算生物学完成的呢?

A3:之前科学家们发现,新冠感染人体的物质叫 S 蛋白。我们可以把它想象成一个英文字母 Y,有两个枝杈,还有一个中轴。S 蛋白的中轴会固定在病毒的表面,而伸出的这两个枝杈(RBD 和 NTD),其中的 RBD 会和我们的受体蛋白发生识别,然后进入人体。 

我们的研究主要围绕着机理还未明确的 NTD 展开。我们和清华大学计算生物学的老师通力合作,利用分子动力学模拟技术对整个 S 蛋白,全构象是百万级原子的巨大体系,进行了数十亿步的动力学平衡模拟。通过分子动力学,我们发现 NTD 就像一个开关,可以去控制另一个枝杈 RBD 是否能和人体的蛋白发生识别、结合。而 NTD 和 RBD 两者结合的界面,就自然形成了药物和疫苗设计的一个潜在靶点。

Q4:计算生物学算是门交叉性非常强的学科,一方面是生物知识和人工智能的交叉,也就是所谓的 BT+IT。另一方面,也是干实验和湿实验的一种交叉。那请问几位老师是如何看待这两种强的交叉关系的? 

A4:计算生物学是一个非常典型的交叉学科。这个交叉二字其实有几个不同的层次。 

首先是知识层面上,有生物学、医学、药学、计算机科学,包括人工智能这些不同的知识门类的交叉。 

还有一个研究方法的交叉,比如说传统生物学的生物实验,就是“湿实验”。计算机的模拟或者人工智能的手段,我们通常称为“干实验”。 

更重要的其实是人才的交叉。因为在这个过程中会涉及到计算机的人才、生物学的人才。而最有趣的是,每个人其实都是有自己的个性的,甚至是有一些偏见的。当我们面对着一个新的课题或者一个新的事物的时候,通常会带入我们固有的一些思维。所以想要让交叉学科发展得非常好,我们就需要一个开放、包容、多元化的环境,让不同的知识做交融,让不同类型的人才去做碰撞,让不同的研究手段去进行互补或者形成某种闭环。

a99fc28dac831a46ae4c1d61427cc1a3.png

对谈嘉宾: 微软亚洲研究院副院长刘铁岩(左二),微软亚洲研究院首席研究员邵斌(右二),微软亚洲研究院主管研究员王童(右一)

Q5: 是否存在哪些明显的瓶颈?

A5:高质量数据。尽管过去我们在生物学领域积累了大量的数据,但是高质量的数据仍然十分短缺。 

从技术上来说,在做计算生物学的过程中,我们还是碰到了非常多的挑战。比如说,真正的蛋白质其实是处在一个非常复杂的细胞环境中的,这种微环境使得计算机的建模难度非常大。比如说在 NTD 的分子动力模拟中,就需要考虑到这个蛋白在人体内真正的环境是什么样的?是不是处在一个水溶液的环境里?是不是会有一些离子?在计算生物学的研究中,我们也要尽量地去仿照人体中真实的微环境,这可能是一个比较大的挑战。 

那还有一个挑战是什么呢?在做计算免疫学的时候,其实每个人内在的免疫环境都是千差万别的。我们做一个 AI 模型,如果想在每个人身上都适用,取得很好的效果,也是很大的一个挑战。这也就是为什么我们要对每个人有一个更个性化的建模过程和解决方案。 

还有动态变化的问题。

生命科学很特别的一点,就是它的研究对象是活的。比如说,人体每天应对着我们所在的环境,包括各种病源的侵扰,我们是不断地在进化、在变化中去抵抗它们的。所以当我们使用传统的机器学习或人工智能的手段去做了分析建模,很可能这个模型未来要使用的对象已经发生了变化。

所以当我们用人工智能的手段去解决这些生物问题的时候,怎么能够做更好的泛化外推,能够去解决和应对生物体本身的变化,这是一个非常有趣的问题,它不仅仅是对计算生物学有意义,对人工智能、对机器学习都是一个新的挑战。

Q6:那我们是如何看待 AI for Science 这种形式的?

A6:当我们用人工智能跟自然科学进行交叉的时候,其实有两个视角。

一个是我们已经知道了自然科学的规律,也产生了很多的数据,我们怎么用人工智能从里面学到某种模型去加速这个过程。

另一分支就是当我们能够有那么多的观测数据,这些数据可能是科学家们用肉眼分析不过来的。如果我们有很好的人工智能技术,我们能不能去通过大量的高通量数据分析,总结出一些现有的科学家还没有发现的科学规律,这个科学发现的价值可能比加速的价值更高。

Q7:在 AI for Science,这个具体的融合过程中,有没有什么经验和大家分享?

A7:人工智能带来了科学研究范式的转型。因为从计算机科学的视角看,现在很多的问题求解不再单纯依赖于人工的算法设计,而更多的是转成以数据驱动的模型构建。

此外,从基础科学研究的视角去看,传统基础科学研究更多是一种提出科学假设,然后验证科学假设的研究范式。随着大数据和人工智能的发展、普及和成熟,我们观察到越来越多的科学研究从假设推动的范式,走向了利用大数据和计算机技术挖掘科学洞见的这种数据驱动的科学研究范式。

从生物科学的角度出发,我们之前更多是基于专业领域知识(domain knowledge)的触发来做研究。通俗来讲,AI 其实只是作为一种计算手段扮演了配角的作用。更多是在有大量的生物学数据和生物领域知识的前提下,用一种非常简单的统计模型或者是机器学习来做简单的拟合。

但伴随着 AI 技术的发展和深化,AI 在 AI for Science 里逐渐变成了主角。它并不是只去对生物数据做简单的拟合,而是从 AI 入手去认识科学问题,即为科学问题量身定制一套 AI 的算法与开发。

但从另一方面来说,传统计算生物学的研究,更多是为了提升性能,也就是追求更高的数字。现在的 AI for Science 并不是这样。以 AI+药物设计研发为例,我们并不像之前一样只关注准确率,而更关注可解释性。比如说在药物虚拟筛选里,是潜在药物的哪些原子和我们的受体蛋白的哪一些残基、哪一些原子能发生相互作用,这个模型能否提供更好的解释性等等。

传统的自然科学领域有一个研究范式,就是科学家们受到实验数据的启发,然后大胆假说提出一套科学理论,再通过设计实验去进一步地验证这些理论或者推论。人工智能其实就是使传统科学家做研究的这种过程变得自动化、规模化、并行化。所以,如果我们说传统的自然科学的发展严重依赖于少数顶级科学家的智慧的话,在未来,有了人工智能技术的加持,我们相信有更多的科学工作者可以以更高的通量去做更了不起的研究。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

7ea0914e1bdd0bd803496173a425e3c8.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482493.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

excel字符串反转

1.新建空白sheet2.altf11调出VB3.插入-模块-填入自定义函数Function REVERSE(Str As String)REVERSE StrReverse(Str)End Function 转载于:https://www.cnblogs.com/AWNUygah/p/11350843.html

Stephen Wolfram专访Judea Pearl:从贝叶斯网络到元胞自动机

来源: 集智俱乐部编译:闫和东、徐培 编辑:邓一雪 导语2022年人工智能与数学国际研讨会(ISAIM 2022)恰逢著名计算机科学家、贝叶斯网络之父 Judea Pearl 85岁生日,会议期间Mathematica创始人 Stephen Wolfra…

excel常用函数

1.截取字符串函数 left()   从左边截取 mid()    从中间截取 right()    从右边截取 转载于:https://www.cnblogs.com/AWNUygah/p/11350904.html

day32 并发编程之锁

并发编程之锁 1. GIL全局解释器锁 2. GIL与普通的互斥锁 3. 死锁 4. 信号量 5. event事件 6. 线程q 1. GIL全局解释器锁 """ In CPython, the global interpreter lock, or GIL, is a mutex that prevents multiple native threads from executing Python bytec…

马斯克Neuralink被曝“虐杀实验猴”,140万元美金项目遭谴责

来源: 学术头条作者:刘芳编辑:黄珊2021 年 4 月,马斯克公布了一段猴子用意念玩乒乓球游戏的视频,一时间为他旗下的脑机接口公司 Neuralink 赚足了眼球。然而最近,这些被用来做脑机接口实验的猴子的经历&…

死前真的会有「跑马灯」,人类首次同步测量大脑濒死状态

来源:新智元编辑:袁榭 好困或许,人死前可能真会眼前出现人生跑马灯!最近,神经科学家在记录了一个濒临死亡的人类大脑的活动之后发现,人在死亡前后有节奏的脑电波模式与做梦、回忆记忆和冥想时出现的模式相似…

七牛图片盲水印

注意 暂时不支持从 dora 数据处理直接调该接口,只支持从 kodo 存储调用。即 cdn 域名不可开通图片瘦身调用形式 资源 http://i.iamlj.com/19-08-12/123936.png 处理参数 watermark/6/method/encode/text/aGVsbG8gcWluaXU 新图 http://i.iamlj.com/19-08-12/123936-w…

「最小细胞」的3D数字模型,计算揭示生命最基本的要求

来源:ScienceAI编辑:萝卜皮无论是海洋深处的奇异生物还是我们体内的细菌,地球上的所有生命都是由细胞组成的。但我们对这些细胞中最简单的细胞如何运作只有一个非常粗略的了解。伊利诺伊大学厄巴纳-香槟分校的一个团队创建了有史以来最完整的…

excel常用技巧

一、单元格内快速换行输入:编辑状态下AltEnter 二、单元格设置斜线分割 作为表头,斜线分割还是比较常用的。 1、选中单元格。 2、右键设置单元格格式。 3、在对话框中选择边框标签。 4、选中斜线选项并确定即可。 5、编辑表头,利用AltEnter输…

Yann LeCun最新发声:自监督+世界模型,让 AI 像人类与一样学习与推理

来源:AI科技评论作者:维克多、西西、王晔编辑:陈彩娴如何突破当代人工智能(AI)的瓶颈?不同学者存在不同观点。总体来看可以概括为两类,其一监督学习者,提倡通过改善数据标签质量&…

day33-进程池和线程池

进程池与线程池 开进程开线程都需要消耗资源,只不过两者比较的情况线程消耗的资源比较少 在计算机能够承受范围之内最大限度的利用计算机 什么是池? # 在保证计算机硬件安全的情况下最大限度的利用计算机 池其实是降低了程序的运行效率 但是保证了计算机…

【转】常用数学函数篇(Linux c)

abs&#xff08;计算整型数的绝对值&#xff09; 相关函数 labs, fabs 表头文件 #include<stdlib.h> 定义函数 int abs (int j) 函数说明 abs()用来计算参数j的绝对值&#xff0c;然后将结果返回。 返回值 返回参数j的绝对值结果。 范例 #ingclude <stdlib.h> main…

两大头号玩家 一个伟大愿景: 联邦学习的元生态建设美好世界

来源&#xff1a;IEEE标准协会新年伊始&#xff0c;世界领先的标准制定机构IEEE标准协会牵头&#xff0c;组织了2022年度联邦学习领域首场重量级尖峰交流活动——联邦学习首创团队带头人、谷歌研究院副总裁Blaise Agura y Arcas博士&#xff0c;与联邦学习亚洲奠基人、IEEE联邦…

物理学的过去、现在与未来

来源&#xff1a;中科院之声&#xff08;ID:zkyzswx&#xff09;、《物理》杂志、中国物理学会期刊网作者&#xff1a;冯端&#xff08;我国著名物理学家、金属和晶体材料学家、教育家&#xff0c;中国科学院院士、第三世界科学院院士、第五届中国物理学会理事长&#xff0c;南…

Android UI之困 横跨四个屏幕的战争

用户界面&#xff08;UI&#xff09;的话题&#xff0c;总是会带来强烈的争论。这有点像电视领域——每个人都是专家&#xff0c;因为每个人都是用户。早在2002年&#xff0c;电信运营商就有一套自己的UI定制界面——例如Vodafone Live 和 Orange SPV。当然&#xff0c;这遭到很…

《MIT科技评论》:2022年全球十大突破性技术

来源&#xff1a;6G俱乐部资料来源&#xff1a;《麻省理工科技评论》近日&#xff0c;《麻省理工科技评论》2022年“全球十大突破性技术”正式发布。此次发布的突破性技术包括&#xff1a;“新冠口服药”“实用型聚变反应堆”“终结密码”“AI蛋白质折叠”“PoS权益证明”“长时…

day34 数据库入门

数据库概念 # 1.随意的存到了一个文件中 数据格式也是千差万别的 # 2.软件开发目录规范规定了数据存放的位置ps:数据都是保存在本地的 # 3.将保存数据的部分 存到一个公共的地方 所有的用户涉及到数据相关 都必须来这个公共地方查找 数据库之MySQL # 本质就是一款基于网络通信的…

PNAS前沿:迈向作为多层学习的进化理论

来源&#xff1a;集智俱乐部作者&#xff1a;郭瑞东编辑&#xff1a;邓一雪导语进化、学习与物理系统的重整化有何相似之处&#xff1f;PNAS的论文“构建将进化视作多层学习的理论”一文&#xff0c;经由统一的理论框架&#xff0c;分析进化过程中的环境预测误差&#xff0c;及…

09.MyBatis的逆向工程

逆向工程:(通过表自动生成实体类和映射文件) 1.导入mybatis-generator-core-1.3.2.jar的jar包 2.在src下创建并编写配置文件&#xff0c;如下&#xff0c; generator.xml 1 <?xml version"1.0" encoding"UTF-8"?>2 <!DOCTYPE generatorConfigur…

「Luogu5395」【模板】第二类斯特林数·行

「Luogu5395」【模板】第二类斯特林数行 problem Solution 一句话题意&#xff1a;求\(_{i0}^n\begin{Bmatrix}n\\i\end{Bmatrix}\) 根据第二类斯特林数的展开式&#xff0c;有\[\begin{Bmatrix}n\\k\end{Bmatrix}\frac{1}{k!}\sum_{i0}^k(-1)^i\begin{pmatrix}k\\i\end{pmatri…