以云战“疫”,这次阿里云又让人们惊了……

本文转载自CSDN博主「L-JingJing」的原创文章

近日,阿里云对外宣布其容器服务调度GPU云服务器启动加速计算,最快只需60秒即可完成新冠病毒的核酸对比工作;同时将向医疗科研机构、疾控中心等一线病毒研究机构免费开放基因计算服务,技术可大幅提升宏基因组测序、疫苗研发相关的处理效率。

基于此,晶少专程采访了阿里云基因计算服务AGS负责人、高级技术专家李鹏,集中呈现针对GPU和容器技术大幅提升核酸比对速度的有关细节以及关于阿里云基因计算服务(AGS)的诸多信息。

据晶少了解,本次阿里云基因计算服务AGS病毒比对能力-mNGS宏基因组比对从设计、研发、验证到最终上线只用了短短20几天,但李鹏所在团队却每天肩负着艰苦卓绝的工作。很关键的一个出发点在于,除了提供针对新冠肺炎病毒中mNGS宏基因组测序数据的快速比对能力之外,更重要的是让研究机构更专注业务创新,而不是数据本身的重复处理工作,这其中就涉及到了生物类型计算解决方案所具有的鲜明特殊性。

晶少:生物计算解决方案有一定的特殊性,相比其他类型的技术解决方案有何不同?

阿里云基因计算服务AGS负责人、高级技术专家李鹏:不同于常规的计算,基因计算对海量数据计算和存储能力有很高的要求,主要通过容器计算的自动伸缩特性和阿里云ECS自动伸缩能力的打通,这才能让AGS具备大规模调度云上计算资源的能力。具体来说通过特定算法对基因数据进行合理切分后,可实现大规模的并行计算以及处理TB级别的样本数据。

过去的基因计算服务以集群化,混合云,弹性为主的AGS工作流服务。但在走过的两年时间里,阿里云提供了基于容器混合云的基因计算方案,整体技术是混合云架构下的云原生容器,达成云上云下资源一体,跨地域集群统一管理。2020年,在以往技术沉淀基础上,阿里云升级了AGS的能力,用公共云API化服务做到即开即用、用完即走,以这次的病毒检测为例,在提供了自定义病毒库灵活性的基础上又使得调用的无服务化,一次调用即能产出比对的最终数据结果并返给用户。

实时荧光定量PCR(RT-PCR)和病原宏基因测序(mNGS)是最早用于确诊新冠病毒感染的方法。由于两项技术各有优劣,联合使用方能实现互补。

RT-PCR是目前新冠病毒的核酸检测主流方法,成本较低,操作简便。现已有众多新冠病毒RT-PCR试剂盒可选,但由于病毒浓度和试剂盒质量问题,其结果出现假阴性较高,导致医生和患者往往需要重复多次检测和长时间等待检测结果。

mNGS的技术优势可通过一次检测便能排查所有已知的病原体,有效避免重复采样的麻烦操作,以及多次检测筛查所需大量样本难以实现的问题。当病毒经过数代传播,还会产生变异,mNGS也是较为有效的追踪方案,配合病毒库可精准确定病毒的代际关系,甚至找到病毒源发地。基于mNGS基因序列比对的分析方式,一旦病原体的基因组已知,通过更新数据库,就可实现高效准确检测出相似病毒的功能,同时对新型病毒以外的其他病原及混合感染进行综合鉴定。但mNGS的缺点是成本较高,需要测序仪和专业的生信分析,并且操作复杂、检测时间相对较长,因此无法实现大范围推广和快速诊断。

如今通过使用阿里云容器服务,科研人员只需在阿里云上通过命令行AGS rna-mapping API 启动比对过程,随即阿里云容器服务调度GPU云服务器启动加速计算,60秒内即可得到高质量匹配reads的数据和初步质量报告,为多种病原体检测和进一步的新冠病毒蛋白质研究及变异研究提供快速准确的数据支撑。

基于此我们发现,本次阿里云方面提供的云服务与以往显著不同,“全套”思想贯穿其中,也就是说所使用的机构不再需要购买额外计算资源,更不用关心如何搭建集群以及考虑算法和网络等诸多问题,只需将数据放入对象存储中并上传,等待授权完成后即可调用云服务来处理数据,产出结果并生成有关报告,“既开即用、用完即走”的特质表现突出。

另外AGS在处理测序仪下机数据的比对、排序、变异检测等环节拥有目前云上最快的加速比,可以达到普通CPU处理速度的百倍,同时又保持了BWA/GATK等主流金标准软件的精度和召回率,大幅度降低了计算的成本,性价比十分可观,也足见其技术探索的功底深厚,但究竟是何种机缘促成了容器技术与基因计算间的火花迸发?

晶少:何时何种契机开始针对容器技术加速基因计算做有关探索的?这种API调用更多意味着什么?

阿里云基因计算服务AGS负责人、高级技术专家李鹏:我们观察到,容器技术一方面在数据分拆、质量控制、Call 变异提供了标准化流程化、加速、弹性、鉴权、观测、度量等能力;另一方面,高价值挖掘需要借助容器化的机器学习平台和并行框架完成大规模线性代数计算建立模型,实现精准医疗。过去的两年中,AGS一直在行业里通过集群化、混合云,弹性为主的AGS工作流服务方式帮助大型的基因测序企业完成当日处理100TB以上的数据的,1年数十PB数据的处理任务,成果显著。

而这种API化的尝试确实能够有效帮助用户摆脱集群的复杂性,资源创建和维护的代价,以极少的存储成本就可以完成任意数量的按需计算需求,成本支出只需要按照处理的数据量和计算量来支付, 实现真正的无服务化和Pay as you go。

有消息表明,阿里云其实早在疫情严峻阶段就宣布向新冠疫苗研发科研机构免费提供一切AI算力,目前已收到了包括浙江大学医学院、GHDDI全球健康药物研发中心、清华大学医学院、北京大学医学院等国内外数十家权威科研机构的申请,第一批申请的算力资源已部署上线、不断为疫苗研发提速加码,但个中情况具体如何呢?

晶少:目前对外申请算力部署的整体情况如何?效果怎样?后续的服务支持有哪些具体方面?未来在助力疫苗药品研制方向有何规划?

阿里云基因计算服务AGS负责人、高级技术专家李鹏:目前AGS已经开通了国内的多个地区的服务,特别是北京、深圳、杭州等都有大型基因公司开始生产使用;另外国外的多个地区也开通了服务,例如法兰克福等疫情重灾区也可以访问到AGS服务。

晶少:新冠状病毒疫情发生后,为了帮助抗攻击疫情,阿里云免费向全球公共科研机构提供高性能计算、SCC 超级计算集群和 CPU/GPU 机器、云超算及 AI 等技术,包括助力在E-HPC云超算上进行药物研发等,这与AGS关系如何?AGS在阿里云技术的对外输出中占据了何种位置或者扮演了怎样的角色?

阿里云基因计算服务AGS负责人、高级技术专家李鹏:AGS主要定位于公有云的开箱即用的Serverless服务,提供给各个生态伙伴,例如基因公司、研究机构、学校等PaaS服务,是可以被集成在各种云端SaaS应用中来实现效率的百倍提升和成本的大幅缩减。当然E-HPC也是阿里云中很有优势的产品线,主要面向科研机构做高分子分析等高性能计算,当然科研机构、疾控中心可以同时使用AGS和E-HPC来形成科研项目互补,并不冲突。

采访接近尾声,可以想见的一点,未来AGS基因计算会继续朝着Serverless与按量付费、按需弹性的持续被集成的路线发展,有幸提供各种人类基因组、动植物以及病毒等基因的加速处理云服务。总体来看随着测序成本、计算成本以及分析成本的持续下降,人们有理由相信基因测序和精准医疗在不远的将来将进入到普通人的常规健康服务列表中,人类对自身基因认知的深入必然推动寿命提升以及战胜各种疾病的可能,云计算服务AGS会推动国内乃至世界范围内普惠精准医疗早日到来。

战疫之下,究竟还有哪些黑科技亟待被发掘?我们更多只需拭目以待!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/518700.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java-增强for循环

public class ForDemo05 {public static void main(String[] args) {int[] numbers {10, 20, 30, 40}; // 定义一个数组for (int number : numbers) {System.out.println(number);}} }https://www.bilibili.com/video/BV12J41137hu?p42&spm_id_frompageDriver

五年从P5到P8,在阿里学做个靠谱的人

师兄文化,是阿里的老传统,新人入职都要认个师兄。 不是江湖上这种师兄哈,但帅是一样帅的 今天和大家聊聊我在阿里当师兄的故事。 我是“改之”,不是“有则改之无则加勉”的改之,而是“杨过,字改之”的那…

@开发者,微软 CEO 萨提亚带领 60 位大咖的集结令,你敢接吗?

2020年初,一场突如其来的疫情打乱了所有人的脚步,给人们的生活、工作、学习带来诸多不便,与此同时,我们看到一些企业迅速响应:各式买菜小程序、远程工具、在线教育的火爆……这背后,是企业的数字化转型步伐…

支付宝技术风险负责人陈亮:把事情做到极致,技术的差异性才会体现出来

“很多事情,说出来很多人都在做,但是只有真正做到极致,技术的差异性才会体现出来”,蚂蚁金服技术风险部研究员陈亮(花名:俊义)在接受 InfoQ 采访时如是说道。在此前的支付宝技术嘉年华&#xff…

Java-break-continue

https://www.bilibili.com/video/BV12J41137hu?p43&spm_id_frompageDriver

2020 年,为什么非要采用 DevOps 文化不可?

来源 | DevOps Zone 译者 | 苏本如,责编 | 夕颜头图 | CSDN 下载自视觉中国出品 | CSDN(ID:CSDNnews)2020年已经到来,它的到来带来了信息和技术(IT)领域的诸多创新和变革,特别是对DevOps技术的创…

走进KeyDB

KeyDB项目是从redis fork出来的分支。众所周知redis是一个单线程的kv内存存储系统,而KeyDB在100%兼容redis API的情况下将redis改造成多线程。 网上公开的技术细节比较少,本文基本是通过阅读源码总结出来的,如有错漏之处欢迎指正。 多线程架…

Java-打印三角形

public class TestDemo01 {public static void main(String[] args) {// 打印三角形 5 行for (int i 1; i < 5; i) {// 先打印出左边的 直角三角形for (int j 5; j > i; j--) {System.out.print(" ");}for (int j 1; j<i; j) {System.out.print("*…

Springboot2.x +JPA 集成 Apache ShardingSphere 读写分离

分库分表背景: 数据库性能瓶颈&#xff1a;主要分为按照业务来划分或者按照数据量来划分。 拆分方式&#xff1a; 水平拆分(每个表的结构都一样)&#xff1a;订单表数据量大&#xff0c;我们可以水平拆分 &#xff0c;分成order表1、order表2、order表3 。。。 垂直拆分&#x…

只要 8 个步骤,学会这个 Docker 命令终极教程!

作者 | Timothy Mugayi译者 | 弯月 责编 | 徐威龙封图| CSDN 下载于视觉中国Docker容器已经从一种锦上添花的技术转变成了部署环境的必需品。有时&#xff0c;作为开发人员&#xff0c;我们需要花费大量时间调试或研究Docker工具来帮助我们提高生产力。每一次新技术浪潮来临之际…

优秀工程师必备的一项技能,你解锁了吗?

阿里妹导读&#xff1a;很多程序员在工作一段时间后会遇到迷茫期&#xff0c;虽有技术傍身&#xff0c;也难免会产生焦虑&#xff0c;反复思考怎样才能快速成长。关于如何提高自己的思考力&#xff0c;运用思考的力量推动能力提升&#xff0c;以此实现技术成长&#xff0c;阿里…

Springboot2.x +JPA 集成 Apache ShardingSphere 分表+读写分离

分库分表背景: 数据库性能瓶颈&#xff1a;主要分为按照业务来划分或者按照数据量来划分。 拆分方式&#xff1a; 水平拆分(每个表的结构都一样)&#xff1a;订单表数据量大&#xff0c;我们可以水平拆分 &#xff0c;分成order表1、order表2、order表3 。。。 垂直拆分&#x…

Java-方法重载

https://www.bilibili.com/video/BV12J41137hu?p47&spm_id_frompageDriver

Blink 有何特别之处?菜鸟供应链场景最佳实践

作者&#xff1a;晨笙、缘桥 菜鸟供应链业务链路长、节点多、实体多&#xff0c;使得技术团队在建设供应链实时数仓的过程中&#xff0c;面临着诸多挑战&#xff0c;如&#xff1a;如何实现实时变Key统计&#xff1f;如何实现实时超时统计&#xff1f;如何进行有效地资源优化&a…

为什么要在油气行业中应用 IoT?这 8 个应用场景告诉你 IoT 在油气行业中可以做什么...

作者 | Vova Shevchyk译者 | 风车云马 责编 | 徐威龙封图| CSDN 下载于视觉中国如今&#xff0c;物联网已经进入了各行各业&#xff1a;汽车、农业、绿色能源。物联网还将征服的领域之一是石油和天然气领域。在这些特殊的行业环境中&#xff0c;公司雇佣专业人员来预测机器何时…

Java-命令行传递参数

package method;public class Demo01 {public static void main(String[] args) {// args.length 数组长度for (int i 0; i < args.length; i) {System.out.println("args["i"]: "args[i]);}} }https://www.bilibili.com/video/BV12J41137hu?p48&…

Spark内置图像数据源初探

概述 在Apache Spark 2.4中引入了一个新的内置数据源, 图像数据源.用户可以通过DataFrame API加载指定目录的中图像文件,生成一个DataFrame对象.通过该DataFrame对象,用户可以对图像数据进行简单的处理,然后使用MLlib进行特定的训练和分类计算. 本文将介绍图像数据源的实现…

Java-可变参数

public class Demo04 {public static void main(String[] args) {// 调用可变参数的方法printMax(34, 3, 3, 2, 56.5);printMax(new double[]{1, 2,4, 3});}public static void printMax(double... numbers) {if (numbers.length 0){System.out.println("没有传递参数&qu…

生产环境使用HBase,你必须知道的最佳实践

来源 | 阿丸笔记封图| CSDN 下载于视觉中国前面&#xff0c;我们已经打下了很多关于HBase的理论基础&#xff0c;今天&#xff0c;我们主要聊聊在实际开发使用HBase中&#xff0c;需要关注的一些最佳实践经验。Schema设计七大原则1&#xff09;每个region的大小应该控制在10G到…