从连接组学到行为生物学,AI 助力使从图像中提取信息变得更快、更容易

626b035c3e892f8f3b6ed1377faffe4d.png来源:ScienceAI

编辑:白菜叶

一立方毫米听起来并不多。但在人脑中,这一体积的组织包含约 50,000 条由 1.34 亿个突触连接的神经「线路」。Jeff Lichtman 想追踪所有这些。

为了生成原始数据,他使用了一种称为串行薄层电子显微镜的协议,在 11 个月内对数千条组织进行了成像。但该数据集非常庞大,达到 1.4 PB(相当于大约 200 万张 CD-ROM),对于研究人员来说,他们自己无法处理。「人类根本不可能手动追踪所有的线路。」马萨诸塞州剑桥市哈佛大学的分子和细胞生物学家 Lichtman 说,「地球上没有足够的人来真正有效地完成这项工作。」

这是连接组学(研究大脑的结构和功能连接)以及其他生物科学中的常见问题,其中显微镜的进步正在创造大量的成像数据。但是,在人力资源失败的地方,计算机可以介入,尤其是经过优化以从大型数据集中梳理出模式的深度学习算法。

「在过去的几年里,我们确实经历了深度学习工具寒武纪大爆发般的爆炸式增长。」麻省剑桥市麻省理工学院和哈佛大学布罗德研究所的计算生物学家 Beth Cimini 说。

深度学习是一种人工智能(AI)技术,它依赖于受大脑中神经元互连方式启发的多层人工神经网络。由于它们基于黑盒神经网络,这些算法有其局限性。其中包括依赖大量数据集来教会网络如何识别感兴趣的特征,以及有时难以理解的生成结果的方式。但是,一系列快速增长的开源和基于 Web 的工具使入门变得比以往任何时候都更容易。

以下是深度学习对生物图像分析产生深远影响的五个领域。

大规模连接组学

深度学习使研究人员能够从果蝇、老鼠甚至人类中生成越来越复杂的连接组。这些数据可以帮助神经科学家了解大脑是如何工作的,以及它的结构在发育和疾病过程中是如何变化的。但是神经连接并不容易映射。

2018 年,Lichtman 与位于加利福尼亚州山景城的 Google Connectomics 负责人 Viren Jain 联手,后者正在为他的团队的 AI 算法寻找合适的挑战。

「连接组学中的图像分析任务非常困难。」Jain 说,「你必须能够远距离追踪这些细线、细胞的轴突和树突,而传统的图像处理方法犯了很多错误,以至于它们基本上对这项任务毫无用处。」这些线可以比一微米更细,并延伸到数百微米甚至毫米的组织。深度学习算法提供了一种自动分析连接组学数据的方法,同时仍能实现高精度。

在深度学习中,研究人员可以使用包含感兴趣特征的注释数据集来训练复杂的计算模型,以便他们可以快速识别其他数据中的相同特征。「当你进行深度学习时,你会说,『好吧,我只是举个例子,你把一切都弄清楚』。」德国海德堡欧洲分子生物学实验室的计算机科学家 Anna Kreshuk 说。

但即使使用深度学习,Lichtman 和 Jain 也有一项艰巨的任务是试图绘制他们的人类皮层片段。仅对 5,000 个左右极薄的组织切片进行成像就需要 326 天。两名研究人员花了大约 100 小时手动注释图像并跟踪神经元,以创建「基本事实」数据集来训练算法,这种方法称为监督机器学习。然后,经过训练的算法自动将图像拼接在一起并识别神经元和突触以生成最终的连接组。

Jain 的团队带来了大量的计算资源来解决这个问题,包括数千个张量处理单元(TPU),这是谷歌内部专门为神经网络机器学习构建的图形处理单元(GPU)。Jain 说,在几个月内处理大约 100 万 TPU 小时所需的数据,之后人类志愿者在协作过程中校对和纠正连接组,「有点像 Google Docs」,Lichtman 说。

他们说,最终结果是在任何物种中以这种详细程度重建的最大此类数据集。尽管如此,它只代表了人类大脑的 0.0001%。但随着算法和硬件的改进,研究人员应该能够绘制大脑的更大部分,同时具有发现更多细胞特征的分辨率,例如细胞器甚至蛋白质。「在某些方面。」Jain 说,「我们只是触及了可能从这些图像中提取的东西的表面。」

虚拟组织学

组织学是医学中的关键工具,用于基于化学或分子染色诊断疾病。但这很费力,而且这个过程可能需要几天甚至几周才能完成。活检被切成薄片并染色以显示细胞和亚细胞特征。然后病理学家阅读载玻片并解释结果。Aydogan Ozcan 认为他可以加快这一进程。

加利福尼亚大学洛杉矶分校的电气和计算机工程师 Ozcan 训练了一个定制的深度学习模型,通过向其展示同一切片的数万个未染色和染色版本的示例,以计算方式对组织切片进行染色,并让模型计算出它们的不同之处。

虚拟染色几乎是瞬间完成的,经过董事会认证的病理学家发现几乎不可能将生成的图像与常规染色的图像区分开来。Ozcan 还表明,该算法可以在几秒钟内复制乳腺癌生物标志物 HER2 的分子染色,这一过程在组织学实验室中通常需要至少 24 小时。由三名获得董事会认证的乳腺病理学家组成的小组将这些图像评为与传统免疫组织化学染色具有可比性的质量和准确性。

旨在将虚拟染色商业化的 Ozcan 希望在药物开发中看到应用。他表示,通过消除对有毒染料和昂贵染色设备的需求,该技术还可以增加全球组织学服务的可及性。

细胞发现

如果你想从蜂窝图像中提取数据,你必须知道细胞在图像中的实际位置。

研究人员通常通过在显微镜下观察细胞或在软件中逐个图像地勾勒出它们来执行这个称为细胞分割的过程。「最能描述人们一直在做的事情的词是『辛苦』。」帕萨迪纳加州理工学院的计算生物学家 Morgan Schwartz 说,他正在开发用于生物图像分析的深度学习工具。但随着成像数据集变得越来越大,这些艰苦的方法正在碰壁。「如果不使过程自动化,你就无法分析其中一些实验。」

16999006792f340c6a3675f18db827d8.jpeg

Schwartz 的研究生顾问、生物工程师 David Van Valen 创建了一套 AI 模型,可在 deepcell.org 上获得,用于计数和分析活细胞和保存组织图像中的细胞和其他特征。

Van Valen 与包括加州斯坦福大学癌症生物学家 Noah Greenwald 在内的合作者开发了一种名为 Mesmer 的深度学习模型,可以快速准确地检测不同组织类型的细胞和细胞核。「如果你有需要处理的数据,现在你可以上传它们,下载结果并在门户网站或使用其他软件包中将它们可视化。」Van Valen 说。

根据 Greenwald 的说法,研究人员可以利用这些信息来区分癌组织和非癌组织,并寻找治疗前后的差异。「你可以查看基于成像的变化,以更好地了解为什么一些患者有反应或没有反应,或者识别肿瘤的亚型。」他说。

映射蛋白质定位

人类蛋白质图谱项目利用了深度学习的另一个应用:细胞内定位。「几十年来,我们一直在生成数百万张图像,概述人体细胞和组织中的蛋白质表达。」斯坦福大学生物工程师兼该项目的联合经理 Emma Lundberg 说。起初,该项目手动注释了这些图像。但由于这种方法不能长期持续,Lundberg 转向了人工智能。

Lundberg 首先将深度学习与公民科学相结合,让志愿者在玩大型多人游戏 EVE Online 的同时对数百万张图像进行注释。

在过去的几年里,她转向了一个众包的仅限人工智能的解决方案,发起了 Kaggle 挑战——科学家和人工智能爱好者竞争完成各种计算任务——37,000 美元和 25,000 美元,用于设计有监督的机器学习模型来注释蛋白质图谱图像。

「之后的 Kaggle 挑战让游戏玩家大吃一惊。」Lundberg 说。获奖模型比 Lundberg 之前在蛋白质定位模式的多标签分类方面所做的努力高出约 20%,并且可以在细胞系中推广。

她补充说,他们管理了一些以前没有发表过的模型做过的事情,那就是准确分类存在于多个细胞位置的蛋白质。

「我们已经证明,一半的人类蛋白质定位于多个细胞区室。」Lundberg 说。位置很重要,因为相同的蛋白质在不同的地方可能表现不同。「了解一种蛋白质是在细胞核中还是在线粒体中,有助于了解有关其功能的许多信息。」

0d13ce270046e8d8b72c68089cc57f3f.gif

追踪动物行为

Mackenzie Mathis 是日内瓦洛桑瑞士联邦理工学院校园生物技术中心的神经科学家,长期以来一直对大脑如何驱动行为感兴趣。她开发了一个名为 DeepLabCut 的程序,使神经科学家能够从视频中跟踪动物的姿势和精细动作,将「猫视频」和其他动物的记录转化为数据。

DeepLabCut 提供了一个图形用户界面,因此科学家可以通过单击按钮上传和标记他们的视频并训练深度学习模型。4 月,Mathis 的团队扩展了该软件以同时估计多种动物的姿势,这通常对人类和 AI 来说都是具有挑战性的。

研究人员将多动物 DeepLabCut 应用到狨猴身上,发现当这些动物靠近时,它们的身体是对齐的,而且它们倾向于朝相似的方向看,而当它们分开时,它们往往会面对面。「这是一个很好的例子,姿势实际上很重要。」Mathis 说,「如果你想了解两只动物是如何相互作用、如何相互观察或观察世界的。」

相关报道:https://www.nature.com/articles/d41586-022-02964-6

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

9bf53e7bf65855b28b420d83757c118a.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481581.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文学习10-Joint entity recognition and relation extraction as a multi-head selection problem(实体关系联合抽取模型

文章目录abstract1.introduction2. 相关工作2.1 命名实体识别2.2 关系抽取2.3 实体关系联合抽取模型3.联合模型3.1 Embedding层3.2 bilstm--编码层3.3 命名实体识别3.4 多头选择的关系抽取模型3.5. Edmonds’ algorithmJoint entity recognition and relation extraction as a …

Gary Marcus:文本生成图像系统理解不了世界,离 AGI 还差得远

来源:AI科技评论作者:李梅、黄楠编辑:陈彩娴AI 作画很牛,但它并不理解图像背后的世界。自从 DALL-E 2 问世以来,很多人都认为,能够绘制逼真图像的 AI 是迈向通用人工智能(AGI)的一大…

论文学习11-Adversarial training for multi-context joint entity and relation extraction(实体关系买抽取模型,对抗学习

文章目录1. introduction2.相关工作3.Model3.1 Joint learning as head selection3.2 AT4.实验设置5.结果6.总结实体关系抽取模型对抗学习. 论文链接 code Bekoulis, G., et al. (2018). “Adversarial training for multi-context joint entity and relation extraction.” ar…

【前沿技术】美国脑计划2.0!投5亿美元,绘制史上最全人脑地图

来源:智能研究院【新智元导读】今天,脑科学计划宣布启动的「细胞图谱网络项目」,目标是绘制世界上最全面的人类大脑细胞图谱。这种雄心,堪比当年的人类基因组计划。今天,美国国立卫生研究院(NIH&#xff09…

HMM总结

文章目录4.HMM-->CRF4.1 HMM--是个序列4.1.1 推断问题(evaluate)4.1.2 viterbi decoding解码4.1.3 学习,参数估计4.1.4计算实例4.1.5 EM(baum-welch算法)的上溢出和下溢出概率图模型code4.HMM–>CRF 4.1 HMM–是个序列 x-观测到的条件…

南科大本科生在《物理评论快报》发文,实现由不定因果序驱动的量子冰箱

来源:FUTURE远见选编:FUTURE | 远见 闵青云 近日,南方科技大学物理系师生在实验中实现了由不定因果序驱动的量子冰箱。相关成果以「Experimental realization of a quantum refrigerator driven by indefinite causal orders」为题发表在《物…

论文学习12-Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data(CRF

文章目录abstract1.introduction1.2 条件模型2.标签偏差问题3.CRF提出条件随机场CRF abstract 我们提出了条件随机场,这是一个建立概率模型来分割和标记序列数据的框架。相对于隐马尔可夫模型和随机语法,条件随机场在这类任务中有几个优势,…

杨振宁六大数理工作赏析 | 祝贺杨先生百岁华诞

来源:返朴撰文:林开亮我的物理学界同事大多对数学采取功利主义的态度。也许因为受我父亲的影响,我较为欣赏数学。我欣赏数学家的价值观,钦佩数学的优美和力量:它既有战术上的随机应变,又有战略上的深谋远虑…

论文学习13Reconstructing the house from the ad: Structured prediction on real estate classifieds(实体关系抽取)

文章目录abstractIntroduction2. 相关工作3.房地产结构预测3.1问题形式化3.2 结构预测模型3.2.1 序列标注问题3.2.2 part-of tree constructLocally trained model (Threshold/Edmonds)Globally trained model (MTT)Transition-based dependency parsing (TB)4.实验5.pipeline总…

优化|深度学习或强化学习在组合优化方面有哪些应用?

来源:图灵人工智能前 言深度强化学习求解组合优化问题近年来受到广泛关注,是由于其结合了强化学习(Reinforcement learning)强大的决策(decision-making)能力和深度学习(deep learning)的各种模型(RNN、Transformer、GNN等等)强大的信息提取表征能力(r…

论文学习14-End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures(端到端实体关系抽取)

文章目录abstract1.introduction2.相关工作3.model3.1嵌入层3.2 序列层3.3实体检测3.4 依赖层3.5 Stacking Sequence and Dependency Layers3.6关系分类3.7 训练4 实验总结本文:Miwa, M. and M. Bansal “End-to-End Relation Extraction using LSTMs on Sequences …

人工智能在基因组学市场增长机会以及整个基因组学领域的最新技术

来源:ScienceAI编译:萝卜皮人工智能等最新技术浪潮已经触及几乎所有行业和企业的海岸。基因组学领域也不例外。在 2020-2030 年的评估期内,最新技术在基因组学领域的日益普及将被证明是基因组学市场人工智能的主要增长贡献者。基因组学可以定…

论文学习15-Table Filling Multi-Task Recurrent Neural Network(联合实体关系抽取模型)

文章目录abstract1 introduction2.方 法2.1实体关系表(Figure-2)2.2 The Table Filling Multi-Task RNN Model2.3 Context-aware TF-MTRNN model2.4 Piggybacking for Entity-Relation Label Dependencies2.5 Ranking Bi-directional Recurrent Neural Network (R-biRNN)3.Mode…

【Brain】大脑里也有个Transformer!和「海马体」机制相同

来源: 墨玫人工智能【导读】Transformer模型性能强的原因是模拟了人脑?我不能创造的,我也不理解。——费曼想要创造人工智能,首先要理解人类的大脑因何有智能。随着神经网络的诞生及后续的辉煌发展,研究者们一直在为神…

CRF总结

文章目录计算下Z(矩阵)1.1 一般参数形式1.2 简化形式Z1.3 矩阵形式1.3.2 Z2.维特比算法3.前向算法4.后向算法5.使用前向后向的概率计算6.期望计算7.参数估计(学习)7.1 梯度上升参考文献CRF 是无向图模型code 它是一个判别式模型建…

CAAI名誉理事长李德毅院士谈机器的生命观

来源:图灵人工智能2022年9月28日上午,为促进人工智能产、学、研、经、用的发展,助力余杭区人民政府建设杭州市人工智能创新发展区,由中国人工智能学会主办的会士系列讲坛—第一期通过线上的形式在余杭区未来科技城成功举办。本次活…

论文学习16-Going out on a limb: without Dependency Trees(联合实体关系抽取2017)

文章目录abstract1. Introduction2. 相关工作3. Model3.1 Multi-layer Bi-directional Recurrent Network3.2实体检测3.3 attention model3.4 关系检测3.5双向编码4.训练5.实验5.2 evaluation metrics5.3 基线和以前的模型5.4 超参数6.结果Katiyar, A. and C. Cardie (2017). G…

困局中的英伟达:进一步是鲜花,退一步是悬崖

来源: AI前线整理:王强、冬梅看看最近几个月的股价,英伟达的投资者肯定不怎么开心:但如果把时间拉长到 5 年,我们看到的故事似乎又不一样了:2020 年底显然是是一个转折点。很多游戏玩家还清楚地记得&#x…

论文学习17-Global Normalization of Convolutional Neural Networks(联合实体关系抽取CNN+CRF)2017

文章目录abstract1.Introduction2.相关工作3.Model全局归一化层(使用线性链CRF)4.实验和分析4.3实验结果总结Adel, H. and H. Schtze “Global Normalization of Convolutional Neural Networks for Joint Entity and Relation Classification.”abstract CNNCRF&g…

特斯拉AI日点不燃仿人机器人的市场热情

来源:科技智谷编辑:Light"仿人机器人的巨大市场蓝海能否兑现,核心还要看产品量产和成本控制。近期,沉寂已久的仿人机器人市场终于迎来了它的“春晚”——特斯拉AI日。根据外媒报道,在9月30日(北京时间…