《Nature》重磅 | 研究员利用机器学习发现近 6000 种未知病毒

作者:李雨晨


《Nature》杂志近日发布消息称,研究人员利用人工智能发现了近6000种未知的病毒。这项工作是在3月15日由美国能源部(DOE)组织的一次会议上提出的,它展示了一种探索地球上巨大而未知的病毒多样性的新工具。


从人类健康到垃圾降解,虽然病毒的影响力十分巨大,但它们却很难被摸透。 科学家们无法在实验室环境中培养大多数病毒,识别其基因序列的尝试也往往无法进行,因为病毒的基因组很小并且进化得很快。


近年来,研究人员通过对来自不同环境的样本进行DNA测序,来寻找未知的病毒。为了识别出现的微生物,研究人员搜索已知病毒和细菌的遗传特征,正如文字处理器的“查找”功能会突出显示文档中包含特定字母的单词。但是这种方法经常失败,因为病毒学家无法搜索他们不知道的东西。


不过,机器学习解决了这个问题,因为它可以发现海量信息中的新兴模式。机器学习算法解析数据,从中学习,然后自主分类信息。


南加州大学洛杉矶分校的计算生物学家Jie Ren表示,“以前,人们没有办法很好地研究病毒,但现在我们有新工具可以找到它们。”


在最近的一项研究中,美国能源部联合基因组研究所(JGI)的计算生物学家 Simon Roux 训练计算机识别不常见的 Inoviridae 病毒家族的基因序列。这些病毒生存在细菌中并改变宿主的行为,例如,它们会使得引起霍乱的霍乱弧菌细菌毒性更强。在加州旧金山召开的会议上,他提出了自己的研究成果。他表示,在他的研究开始之前已经有不到100种基因组被发现。


Roux提出了一种机器学习算法,其中包含两组数据:其中一组含有来自已知的Inoviridae的805个基因组序列,另一个含有来自细菌和其他类型病毒的约2000个基因序列。该算法可以找到区分它们的方法。


接下来,Roux 向模型馈送大量宏基因组学数据集。该计算机回收了超过10000种的Inoviridae基因组,并将其分成不同种类的集群。他说,其中一些集群之间的遗传变异很大,以至于Inoviridae可能有很多家族。


据了解,在另一项研究中,巴西圣保罗大学的生物信息学家Deyvid Amgarten利用机器学习在城市动物园寻找肥料堆中的病毒。他编写了算法来搜索病毒基因组的一些显著特征,例如给定长度的DNA链中的基因密度。训练结束后,计算机复原了几个似乎是新型的基因组,Amgarten表示。他在JGI会议上介绍了他的结果。最后一步是了解这些病毒产生的蛋白质,看看它们中的哪些会加速有机物质分解的速度。“我们想提高肥料的质量。”他说。


Amgarten 是从去年报告的一项机器学习工具即 Ren 的团队开发的 VirFinder 中得到灵感的。VirFinder被设计为寻找 DNA 碱基组合,例如 DNA 双链中的 AT 或 GC。据了解,Ren将该算法应用于健康人和肝硬化患者(一种由肝炎、慢性酒精中毒引起的疾病)的基因组样本。机器将取样的病毒完成了分组之后,该团队注意到样本中某些特定类型的基因组在健康人群中相对更少或更多,这意味着这些基因组相关的病毒可能导致了疾病。


Ren的发现是一个引人注目的发现:生物医学研究人员一直在想,病毒是否会导致一些难以捉摸的症状,如慢性疲劳综合征(也称为肌痛性脑脊髓炎)和炎症性肠病。康涅狄格州法明顿的Jackson基因组医学实验室的免疫学家Derya Unutmaz推测,病毒可能会引发一种破坏性炎症反应,或者他们可能会改变人体微生物群中细菌的行为,反过来会破坏新陈代谢和免疫系统。


Unutmaz说,通过应用机器学习,研究人员可以确定隐藏在患者身上的病毒。此外,由于AI有能力在海量数据集中寻找模式,这种方法也许可以将病毒数据与细菌相关联,然后将症状数据与蛋白质变化联系起来。Unutmaz说,“机器学习甚至可以揭示我们从来没有想过的问题。”


原文地址:https://www.nature.com/articles/d41586-018-03358-3


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/496556.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql limit to hosts matching_MySQL 用户访问限制 -- Host Match Limit

笔者前几日在做数据库迁移的时候,发现了一个挺有意思的小东西:数据库访问限制(Host Match limit),简单地翻阅了下给官方资料,发现这个东西应用场景其实非常广泛,只是我们采用了其他可能没有原生数据库带的Access Limit 功能好地方…

数字电路中的Multi-bits跨时钟域设计

数字电路中的Multi-bits跨时钟域设计跨时钟域同步设计跨时钟域处理目标Multi-bits的Clock Domin Crossing (CDC) 电路设计1-bit "Guard" 信号同步multi-bits数据其他的Multi-bits跨时钟域同步设计跨时钟域电路的仿真验证跨时钟域同步设计 跨时钟域处理目标 在跨时钟…

ACM公布2017年图灵奖,大卫·帕特森和约翰·轩尼诗获奖

来源:网络大数据刚刚,美国计算机协会(ACM)宣布 John L. Hennessy 和 David A. Patterson 荣获 2017 年图灵奖。目前这两位学者都供职于谷歌,前者是谷歌母公司 Alphabet 的董事会主席,后者任谷歌杰出工程师,致力于研究机…

Java加密与解密的艺术~DES实现

密钥长度与安全性成正比,但Java仅支持56位密钥长度,作为补充,Bouncy Castle 提供64位密钥长度支持。在此基础上配合不同填充方式(如PKCS5Padding,PKCS7Padding),可显著提高加密系统的安全性。 D…

YOLOv8改进 | 主干篇 | 利用SENetV2改进网络结构 (全网首发改进)

一、本文介绍 本文给大家带来的改进机制是SENetV2,其是2023.11月的最新机制(所以大家想要发论文的可以在上面下点功夫),其是一种通过调整卷积网络中的通道关系来提升性能的网络结构。SENet并不是一个独立的网络模型,而是一个可以和现有的任何…

Linux学习路线及网络编程经典书籍

linux学习资源整理:https://zhuanlan.zhihu.com/p/22654634 Linux初学者(学习资料):https://zhuanlan.zhihu.com/p/21723250 知乎 - 你是如何学习 Linux 编程的?:https://www.zhihu.com/question/20730157 如果让你推荐一本 Linux…

在Windows 7解决GAC错误

调试一网站源代码出现下面的错误 错误 1 Could not load file or assembly Microsoft.ReportViewer.WebForms, Version8.0.0.0, Cultureneutral, PublicKeyTokenb03f5f7f11d50a3a or one of its dependencies. The system cannot find the file specified. D:\3layerhotel\WebS…

CVPR 2018 | 腾讯AI Lab入选21篇论文详解

来源:腾讯AI实验室近十年来在国际计算机视觉领域最具影响力、研究内容最全面的顶级学术会议CVPR,近日揭晓2018年收录论文名单,腾讯AI Lab共有21篇论文入选,位居国内企业前列,我们将在下文进行详解,欢迎交流与讨论。去年…

Java加密与解密的艺术~DESede实现

DESede 实现 /*** 2009-10-5*/ package org.zlex.chapter07_2;import java.security.Key;import javax.crypto.Cipher; import javax.crypto.KeyGenerator; import javax.crypto.SecretKey; import javax.crypto.SecretKeyFactory; import javax.crypto.spec.DESedeKeySpec;/*…

推荐!神经进化才是深度学习未来的发展之路!

来源:全球人工智能过去几年时间里,我们有一个完整的团队致力于人工智能研究和实验。该团队专注于开发新的进化计算方法(EC),包括设计人工神经网络架构、构建商业应用程序,以及使用由自然进化激发的方法来解…

linux 命令:ping、fping、gping、hping3、tracert、traceroute

From: Nmap、Netcat、Hping3工具对比:http://www.2cto.com/article/201210/158961.html ​hping3 命令:http://man.linuxde.net/hping3 示例:Testing firewall rules with Hping3 :https://www.docin.com/p-74538211…

Java加密与解密的艺术~数字签名~模型分析

甲方作为消息的发送方,乙方作为消息的接收方。假设甲乙双方在消息传递之前已经指定了要使的数字签名算法(如RSA算法)。为完成签名验证,甲乙双方需要以下操作: 1)、由消息发送方(甲方&#xff09…

excel概率密度函数公式_标准正态分布密度函数公式

展开全部标准正态分布密度函数公式:正态曲线呈钟型62616964757a686964616fe58685e5aeb931333366306532,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为…

2017-2018中国物联网产业全景图谱报告——物联网对产业深度变革已开启

来源:物联网智库丨公众号如果说2016年里物联网的产业生态各种要素已具备,那么2017年就是物联网对于国民经济产业变革的规模效应初显的一年,可以说是物联网对产业变革的元年。在这一过程中,通过二维生态图谱去了解过去一年的进展不…

Java加密与解密的艺术~数字签名~RSA实现

RSA 实现 /*** 2008-6-11*/ package org.zlex.chapter09_1;import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerator; import java.security.PrivateKey; import java.security.PublicKey; import …

科技部认定的独角兽名单来了!共164家

来源:中国证券报丨公众号 作者:杨洁今天上午, 科技部火炬中心、中关村管委会、长城战略咨询、中关村银行联合主办“2017中国独角兽企业发展报告”发布会。《2017中国独角兽企业发展报告》显示: 2017年中国独角兽企业共164家新晋62…

《Head First 设计模式》专题上线

立即访问《Head First 设计模式》专题 我们为这本经典图书制作了专题,也想在此了解一下园子里有哪些朋友看过这本书。 --- 博客园团队 2008年12月26日 转载于:https://www.cnblogs.com/bookshop/archive/2008/12/26/1363084.html

Java加密与解密的艺术~数字签名~DSA实现

DSA 实现 /*** 2008-6-13*/ package org.zlex.chapter09_2;import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerator; import java.security.PrivateKey; import java.security.PublicKey; import …

tcpdump - 数据包进行截获的包分析工具

From:http://www.cnblogs.com/ggjucheng/archive/2012/01/14/2322659.html 30 分钟掌握 tcpdump:http://zhuanlan.51cto.com/art/201701/527498.htm Android tcpdump 下载:https://www.androidtcpdump.com/android-tcpdump/downloads tcpdum…

相持不下的争论:脑波,有用吗?

来源:原理、编译:糖兽在大脑中,存在着我们看不见的脑电活动。这些脑波是由在大脑周围大量存在神经细胞的协调发射而产生的,他们可以从大脑的前部传到后部,从大脑深处传到头皮。这种脑电活动被称为神经元振荡。有意思的…