了解宇宙万物的“第三种方法”​,人工智能正在改变科学

640?wx_fmt=jpeg

来源:quantamagazine

编辑:张卓骏、luciana、笪洁琼、Aileen


当今物理和天文实验所产生的海量信息,没有任何一个人或者团队可以完整的处理。


有些实验数据每天以千兆字节的规模在增加——而且这个趋势只会越来越明显。


想象一下,一台以平方公里为单位阵列的射电望远镜,预计将于2020年中开始进行科学观测,每年将产生的信息数量可与整个互联网相匹敌。

面对如此信息洪流,许多科学家不得不求助于人工智能。


这是一个研究者眼中神奇的工具。


只需少许人工输入,包括人工神经网络(计算机模拟人脑神经网络)在内的人工智能系统就可以轻松处理成千上百万条信息,并发现其中的异常和人类绝难识别的模式。


利用计算机协助科学研究的历史可以被追溯到75年前。


早在几千年前,人类就已经开始从数据中寻找有效信息。科学家认为机器学习和人工智能所运用的前沿技术,是一种研究科学的全新方法。


这种方法,即生成模型(generative modeling),仅基于数据就可以找到与观测数据相关的诸多解释中最为合理的理论。更重要的是,这一过程无需预先编程,对于系统可能产生作用。生成模型的支持者觉得它的创新程度可以被认为是了解宇宙的潜在的“第三种方法”。


通常,我们通过观察来知晓万物。约翰尼斯·开普勒就是通过研究第谷·布拉赫的星象图来试图找到天体运动的规律(所有行星都是椭圆轨道上运行的),建模同时也推动着科学进步。天文学家模拟银河与其邻近星系仙女座的移动轨迹后,预测两星系将于几百万年之后相撞。观察和建模都能帮助科学家建立假设,而用进一步的观察来检验假设。相较之下,生成模型区别于以上两种方法。


“这是第三种方法,介乎于观察和建模之间。”天文学家Kevin Schawinski介绍说。他此前一直就职于苏黎世联邦工业大学(ETH Zurich),同时也是当今生成模型最狂热的支持者之一。“它提供了一种解决问题的新方法。”


有些科学家将生成模型和其他新技术简单地归类为研究传统科学的工具。但绝大部分人的共识则是人工智能能够带来巨大的影响,而且在科学研究领域的作用也将越发显著。费米实验室的天体物理学家Brian Nord以用人工神经网络研究宇宙而闻名。


他担心人类科学家所做的一切都可以被自动化,而持有这种观点不在少数。Nord说,“这种想法让我感到恐慌”。


神奇的GAN,基于生成的探索


还在读书的时候,Schawinski已经在数据驱动科学领域已经小有名气。博士学位期间,他的课题是基于表象对数千个星系进行分类。由于当时还没有可以用来解决问题的软件,Schawinski就想到了采用群众外包的方式——因此大众科学星系园项目也就应运而生。


自2007年起,天文学家开始用电脑录入关于星系分类的最佳猜测,在多数决定原则下通常被证明为是正确的分类。之后这一项目取得了成功,但Schawinski却意识到人工智能已经可以取而代之。“在今天,一个有天赋、有机器学习背景且懂得云计算的科学家能够在一个下午完成所有的工作。”


Schawinski在2016年开始使用生成模型这种新工具。本质上,生成模型在确定条件X的前提下有多少概率能够得到结果Y。这个方法已被证明极为有效且运用广泛。例如,你用生成模型处理一组人脸照片,每张照片都标记了主人公的年纪。电脑程序在梳理这些“训练数据”时,会有意识地将较老的面容和逐渐增加的皱纹数量关联在一起。


最终,它就有能力“识别”人脸所对应的年纪——原理是它能够预测任何年龄段人脸所可能产生的变化。


640?wx_fmt=jpeg以上的人脸都是生成的。上图第一行(A)和左边第一列(B)是由生成对抗网络(GAN)借助真人人脸构建模块构成的。GAN随后将A中人脸的基本特(如年龄和脸型)与B中细致特征(如发色和眼球颜色)相结合,生成了上图中其他的人脸。


生成模型系统中最有名的就是生成对抗网络(GAN)。在充分接触训练数据后,一个生成对抗网络能够修复像素损坏或确实的图像,或是锐化那些模糊的照片。生成对抗网络通过对比的方法(即对应着术语“博弈”)来推断出缺失信息:该网络的组成部分之一生成器负责生成假数据,而另外的组成部分鉴别器则负责在数据中区分出这些假数据。随着程序的运行,两个组成部分的表现也得到了显著提升。尤其是在由生成对抗网络最新提供的超现实人脸中,如同上图标题中所示,有一些让你感觉“不存在于我们的世界却又真实地吓人”。


更宽泛的说法,生成模型吸收数据(通常为图像,但也不完全是)并拆分成一组基本但抽象的构建模块——科学家将其成为数据的“隐空间”。该算法操控隐空间的元素来探究其如何影响源数据,而这也能帮助发现系统中正在运行的物理变化。


隐空间的概念很抽象且难以用视觉表现,但假设用一个粗略的比方,想一想当你在判断人脸对应的性别时你的大脑究竟在如何运转。你可能会关注到发型、鼻子形状等,以及难以用言语表达的其他特征。电脑程序也在相似地寻找数据中地显著特征:虽然它不会知道什么是胡子或性别,但如果学习的训练数据中有标记着“男性”、“女性”或“长着胡子”的照片时,电脑程序将会很快地推断出两者之间的相关性。


12月发表在《Astronomy & Astrophysics》期刊的一篇论文中,Schawinski和他在苏黎世联邦工业大学的同事Dennis Turp和Ce Zhang使用生成模型来研究星系演化过程中的物理变化。(他们所用的软件与生成对抗网络相似,但其在对隐空间处理的技术与生成对抗网络有所差异,所以从技术角度来说并不属于生成对抗网络)他们的模型创建了人工数据集,用于测试物理变化的假设。比如说,他们想知道恒星形成的“淬火”——形成速率中的快速减弱——与星系环境密度的关联性。


对Schawinski而言,关键问题是仅凭数据本身能够挖掘多少和恒星与星系演变相关的信息。“让我们忘记所有关于天体物理学的知识。”他说,“仅仅使用数据本身,我们又能在多大程度上重新认识这些知识?”


首先,星系的图片被压缩到它们的隐空间。Schawinski随即微调空间中的某一个元素,使其能对应上该星系的特定环境变化——比如,周边物质的密度。接着,他就可以重新生成一个星系来观察不同之处。“所以现在我就拥有了一台假设生成设备。用它可以使我手上所有原本都是处于低密度环境的星系看上去都像是在高密度环境中一样。” 


Schawinski他们发现当星系改变所处环境从低密度变成高密度时,星系的颜色变得更红,星系中的恒星也变得更加向中部集中。Schawinski指出这些观察结果与现存的星系观测相吻合,但问题是为什么会这样。


Schawinski说后续分析步骤还没有实现自动化,“我必须以人类的身份参与其中,那么试想‘究竟是怎么样的物理原理可以来解释这种效应?’”对这个问题有两种解释:星系在高密度环境中变得更红可能是因为高密度环境中充斥着很多尘埃,亦或是因为恒星的形成变少了。(换句话说,星系中的恒星变得更老了)现在,有了生成模型就可以检验这两种思路。改变隐空间中与尘埃和恒星形成速率相关的元素来探究它们如何影响星系的颜色。“答案是显然的。”Schawinski说,“星系变红是恒星形成变慢,而并不是受尘埃的影响。因此,我们应该采纳这种解释。”


640?wx_fmt=jpeg


利用生成概率模型,天体物理学家可以研究宇宙星系从低密度区到高密度区过程的变化,以及导致这些变化的物理过程,这是一种与传统模拟方法相依相异的方法。Schawinski教授指出,假设驱动是模拟的本质,研究中涉及的基本物理定律决定了系统所显示得结果。在所有物理假设成立的基础上,我们将一个行星结构和一个暗物质行为导入系统,模拟其过程并运行,结果在一定程度上与现实相反,但事实上,我们并不知道真实情况及需要的假设条件,我们寄希望于数据本身所产生的结果。


模拟的成功并不能取代天文学家和研究学者的地位,但这意味着在天体物理学域,对象和过程的学习程度的发生转变:我们通过生成概率模型,从庞大的数据库获取信息变得唾手可得。Schawinski教授指出,虽然这不是完全自动化的科学,但表明我们有能力在一定程度上构建自动化科学过程的工具。


生成概率模型显然是强大的,但它是否真正代表了一种新的科学方法呢?


供职于纽约大学及Flatiron研究所(与Quanta一样都由Simons基金会资助)的宇宙学家David Hogg教授指出,这项技术虽然令人叫绝,但归根结底来说,只是一种从数据中提取规律的复杂方法。几个世纪以来,天文学家一直在使用这种先进的方法进行数据观察和分析。


Hogg教授和Schawinski教授的工作都对AI十分依赖,Hogg教授使用神经网络方法,根据光谱对恒星进行分类,并使用数据驱动模型推断恒星的其他物理属性。他认为他和Schawinski教授的工作都是经过实践检验的科学,并且不认为这是第三种科学方式。他们致力于打造一个成熟运用数据的团体,尤其是在数据比较方面,即使现在Hogg教授的工作仍有待观察。


任劳任怨的AI助理


无论在概念上是否具有新颖性,很明显AI和神经网络已经在当代天文学和物理学研究中扮演了重要角色。


在海德堡理论研究所,物理学家Kai Polsterer教授的天文信息学小组,致力于研发以数据为中心的天体物理学研究方法。最近,他们一直在使用机器学习算法从星系数据集中提取红移信息,这在以前是一项艰巨的任务。


Polsterer教授将这种基于AI的系统称作“任劳任怨的助理”,该系统可以连续梳理数据数小时,不厌倦不抱怨,完成所有繁琐乏味的工作,这让研究人员有时间和精力做一些他们擅长的有趣的科学研究。


Polsterer教授指出系统并不是完美无缺,算法只能执行训练过的事项,对于未知输入无法响应。例如,如果输入一个已知星系,系统可以估计它的红移信息和年龄,但如果输入一张自拍照或腐烂的鱼的图片,系统也会输出一个极端错误的估计年龄。在此案例中人类科学家扮演者重要角色,由此他认为此项技术最终需要研究人员负责监控及解释。


供职于费米实验室Nord教授指出重要的一点:神经网络方法不仅要提供计算结果,而且要提供误差区间——这是每个大学生统计课上都学过的。在科学领域,如果只计算而不提供相关误差估计,那么结果并不值得信任。


和其他AI研究员一样,Nord教授也担心神经网络系统结果的“不易解释”这一缺陷,通常系统提供的仅是结果,而不显示具体这些结果是如何得到的。


然而并不是所有人都认为这是一个问题。法国CEA Saclay理论物理研究所的研究员Lenka Zdeborová指出,人类的直觉也是如此“不易解释”。比如你看一张照片后立即认出是一只猫,但事实上你不知道这是怎么回事,从某种意义上说,大脑就是一个黑盒子。


不仅是天体物理学家和宇宙学家向AI推动的数据驱动、数据推动科学迁移,量子物理学家也使用神经网络来解决一些十分棘手且重要的问题。


供职于周界理论物理研究所和安大略省滑铁卢大学的Roger Melkoof教授,使用神经网络技术解决了描述多粒子系统的数学波函数问题。Melkoof教授将必不可少的AI技术称为“维数的指数诅咒”,波函数形式的可能随粒子数量呈指数增长。这一模拟过程的难点类似尝试在象棋或围棋游戏中找出最佳走法,即你在试图走下一步前,会想象你的对手会如何应对,在这些走法中选择最佳的一个,但每走一步,可能性就会呈指数激增。


当然,AI系统已经掌握了国际象棋和围棋游戏的玩法,从十年前征服国际象棋,到2016年AlphaGo击败了人类顶级围棋棋手。Melkoof教授由此认为,人工智能在量子物理学中同样具有适用性。


科学研究的“第三种方法”


无论Schawinski教授认为AI是科学研究的“第三种方法”是否正确,或者如Hogg教授认为,这种方法只是传统观察和数据分析的“外挂”,但毫无疑问的是AI正在改变科学发现方法,并起到明显的促进作用,那么AI革命将在科学研究上走多远?


有人对“机器人科学家”的成就夸夸其谈。十年前,一位名叫亚当的AI机器人化学家研究了面包酵母的基因组,并找出了制造特定氨基酸的基因。亚当通过观察某些基因缺失的酵母株,将结果与具有这些基因菌株的行为进行比较。


最近,格拉斯哥大学的化学家Lee Cronin教授一直在使用机器人随机混合化学物,看看会形成什么样的新化合物。该系统通过质谱仪、核磁共振仪和红外光谱仪实时监测反应并最终预测哪种组合反应最为强烈。Cronin教授指出,即使这个机器人系统不能带来进一步的发现,它也能使化学家们的研究速度提高约90%。


苏黎世联邦理工学院的另一组科学家去年利用神经网络,从一组数据中推导出了相关物理定律。他们的系统类似于机器人开普勒(kepler),通过记录从地球上看到太阳和火星在天空中的位置,重新发现了太阳系的日心模型,并通过观察碰撞的球体,得出了动量守恒定律。由于物理定律通常不止一种表达式,研究人员想知道这个系统是否会提供新的方法表达已知物理定律。


以上都是AI启动科学发现过程的案例,尽管在每种情况下,我们都可以讨论这种新方法的革命性。但最有争议且紧急的问题是,在这个数据堆积如山的时代,我们能从中收集多少信息。


在《The Book of Why》(2018)一书中,计算机科学家Judea Pearl和科学作家Dana Mackenzie指出,数据其实并不是十分智能,数据无法解释因果关系,使用各个模型分析数据的论文或研究都只给出结果或变换数据,不能做出解释。Schawinski教授同意Pearl教授的观点,但是指出这种观念偷换了概念,他从未声称要以这种方式推断因果关系,而只是使用这种方法可以比常规方法做的更多。


科学需要创造力,但到目前为止,没有恰当的方法将创造力引入机器编程。Polsterer教授说“提出一个有逻辑的新理论需要创造力。而每当你需要创造力的时候,你就需要人类。”创造力从何而来?Polsterer教授觉得创造力和“无聊”有关,机器是无法感受到无聊的。“想变得有创造性,你必须讨厌无聊。我不认为机器会觉得无聊。”但另一方面,我们却用着“创意”和“灵感”等词汇来描述深蓝(Deep Blue)和AlphaGo等程序。描述机器“思想”内部发生了什么的困难反映了我们探索自己的思维过程是多么的困难。


Schawinski教授最近离开学术界进入了私企,运营一家名为Modulos的初创公司,Modulos雇佣了许多ETH的科学家,公司在官网口号是,“在AI和机器学习的发展风暴中心工作”。无论当前的AI技术和成熟技术间存在何种障碍,他和其他专家都认为,机器人已经准备好做越来越多的人类科学家的工作,即使机器在这方面存在一定限制性。


在可预见的未来,我们能否制造出一台使用生物硬件的机器,能够解决那些连世界上最聪明的人类也无法独立完成的物理或数学问题。科学的未来最终是否有可能归宿于机器驱动,令人期待。


相关报道:

https://www.quantamagazine.org/how-artificial-intelligence-is-changing-science-20190311/


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/491328.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pytorch的backward参数

首先,如果out.backward()中的out是一个标量的话(相当于一个神经网络有一个样本,这个样本有两个属性,神经网络有一个输出)那么此时我的backward函数是不需要输入任何参数的。 运行结果: 不难看出&#xff0c…

C#表格文字多收缩样式

C#表格文字多收缩样式 <style>.divOpen {height: 24px;overflow: hidden;} </style> ----------------- var html <div class"divOpen" οnclick"divClick(this)" style"cursor: pointer; min-width:100px;">;html value;ht…

意识的哲学、生理及智能属性研究

来源&#xff1a;人机与认知实验室摘要&#xff1a;意识问题一直是各个领域最棘手的难题。本文将从意识的哲学属性、意识的脑属性和意识的智能属性三个角度&#xff0c;分别研究意识研究领域中主要观点与所遇困境&#xff0c;并在文章最后介绍目前已有的意识理论与模型。关键字…

美国反垄断调查背后,硅谷科技巨头不为人知的“阴暗面”

来源&#xff1a;军工圈6月4日&#xff0c;美国众议院司法机构小组委员会负责人向媒体证实&#xff0c;美国政府准备对亚马逊、苹果、Facebook和谷歌4大科技巨头进行反垄断调查。据称&#xff0c;执行反垄断法的美国联邦贸易委员会&#xff08;以下简称FTC&#xff09;和美国司…

第十一章 AtomicInteger源码解析

1、原子类 可以实现一些原子操作基于CAS下面就以AtomicInteger为例。 2、AtomicInteger 在没有AtomicInteger之前&#xff0c;对于一个Integer的线程安全操作&#xff0c;是需要使用同步锁来实现的&#xff0c;当然现在也可以通过ReentrantLock来实现&#xff0c;但是最好最方便…

趋势 | 2019年人工智能行业的25大趋势

来源&#xff1a;网易智能知名创投研究机构CB Insights调研了25种最大的AI趋势&#xff0c;以确定2019年该技术的下一步趋势&#xff0c;他们根据行业采用率和市场优势评估了每种趋势&#xff0c;并将其归类为必要、实验性、威胁性、暂时的。1胶囊网络将挑战最先进的图像识别算…

工业视觉系统相关知识和选型介绍(一):相机篇

工业视觉系统相关知识和选型介绍&#xff08;一&#xff09;&#xff1a;相机篇一、工业视觉系统二、工业相机三、关键名词解释四、工业相机选型五、工业相机品牌六、相机选型实例一、工业视觉系统 1.机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉…

终于看见光的速度了:每秒一万亿帧的相机,拍摄到光的运行状态!

来源&#xff1a;机械发明爱好者我是谁&#xff0c;我在哪&#xff0c;我看到了什么&#xff0c;不会是手电筒照射的吧&#xff08;光移动的时候是在标签里面的&#xff0c;所以不可能是手电筒照射的&#xff09;。这个就是传说的中的飞秒拍摄技术飞秒&#xff08;femtosecond&…

win10下TensorFlow-GPU安装(GTX1660+CUDA10+CUDNN7.4)

首先安装anaconda Anaconda下载地址&#xff1a;https://www.anaconda.com/download/ 注意在安装时勾上第一项&#xff1a; 安装CUDA10.0&#xff1a; CUDA下载地址&#xff1a;https://developer.nvidia.com/cuda-toolkit-archive 安装CUDA前会先运行一个系统检查&#xff…

工业视觉系统相关知识和选型介绍(二):镜头篇

工业视觉系统相关知识和选型介绍&#xff08;二&#xff09;&#xff1a;镜头篇一、工业镜头介绍二、 关键名词解释二、图解镜头基本参数三、镜头选型四、常用工业镜头品牌一、工业镜头介绍 镜头的基本功能就是实现光束变换&#xff08;调制&#xff09;&#xff0c;在机器视觉…

《科学美国人》评出2019年十大突破性技术

来源&#xff1a;科技日报日前&#xff0c;著名科普杂志《科学美国人》公布了2019年十大突破性技术榜单。榜上有名的既有“高深莫测”的新型核反应堆和DNA存储&#xff0c;也有“平易近人”的新型肥料和食品包装。科技日报记者梳理后发现&#xff0c;这十大技术可分为清洁环境、…

MFC 学习笔记(一):MFC单文档程序运行流程梳理与总结

MFC 学习笔记&#xff08;一&#xff09;&#xff1a;MFC单文档程序运行流程梳理与总结 1.MFC单文档程序运行流程 1.首先利用全局变量对象 theApp 启动应用程序 &#xff08;这是因为这个全局对象&#xff0c;基类CWinApp中 this 的指针才能指向这个对象。&#xff09; 2.调…

对话清华教授孙茂松:第三代人工智能要处理“可解释性”问题

来源&#xff1a;澎湃新闻正如人类会综合利用视觉、听觉、触觉、语言等信息&#xff0c;让人工智能&#xff08;AI&#xff09;从多角度、多模态、多学科学习自然语言也是清华大学人工智能研究院的目标与任务。2019年7月1日&#xff0c;清华大学人工智能研究院第八个研究中心&a…

QT学习笔记(一):VS2013 +QT 5.8 运行、编译问题解决

QT学习笔记&#xff08;一&#xff09;&#xff1a;VS2013 QT 5.8 运行、编译问题解决 jom: E:\C\4.QT\HelloWord\Makefile.Debug [debug\moc_predefs.h] Error 1 ‘cl’ 不是内部或外部命令&#xff0c;也不是可运行的程序 或批处理文件。 jom: E:\C\4.QT\HelloWord\Makefile…

使用清华镜像安装pytorch失败的解决方法

首先添加清华镜像至Anaconda仓库&#xff1a; conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes …

受精卵或非“生命起始”?网友:教材是不是要改了……

来源&#xff1a;中国新闻网一直以来&#xff0c;科学家们都认为&#xff0c;精卵结合受精以后就是生命。但是&#xff0c;最近中美胚胎学家的一项最新联合研究成果表明&#xff0c;人类受精卵存在两套独立纺锤体&#xff0c;即从精卵结合到发生第一次有丝分裂期间&#xff0c;…

利用Excel进行成对(配对)T检验

首先在Excel中添加数据分析工具 https://jingyan.baidu.com/article/c275f6ba74b69ee33d7567c8.html 在Excel添加要分析的两组数据&#xff1a; 点击数据——>数据分析&#xff0c;选择t-检验&#xff1a;平均值的成对二样本分析&#xff0c;分别选取两组要分析的数据和输…

垃圾要分类!我们的大脑如何处理垃圾呢?

来源&#xff1a;中国生物技术网最近&#xff0c;垃圾分类已经成了热点话题&#xff0c;但实行这一举措的最终目的还是为了保护我们赖以生存的地球环境。同样&#xff0c;大脑为了维持健康&#xff0c;也专门有一套自己的“垃圾清除系统”&#xff0c;即glymphatic&#xff08;…

QT学习笔记(三):Qt软件打包发布(QT5.8 _msvc2013_64+Win10_64)

QT学习笔记&#xff08;三&#xff09;&#xff1a;Qt软件打包发布&#xff08;QT5.8 _msvc2013_64Win10_64&#xff09;1.编译方式介绍&#xff1a;2.动态编译方式打包发布QT程序&#xff1a;方法一&#xff1a;手动复制方法二&#xff1a;使用工具问题&解决&#xff1a;环…