使用TensorFlow,GPU和Docker容器进行深度学习

摘要: 数据科学家使用GPU来提高TensorFlow的计算速度,但GPU价格昂贵,也需要对其所占用的资源进行认真的管理。本文将带你来一起解决这一问题。

在过去的几个月中,我和多个企业的数据科学团队进行了多次合作,也看到越来越多的机器学习和深度学习框架被广泛应用到实际生活中。

与大数据分析和数据科学中的其他用例一样,这些团队希望在BlueData EPIC软件平台上的Docker容器中运行他们最喜欢的深度学习框架和工具。因此,我的一部分工作就是尝试使用这些新工具,确保在我们的平台上能够运行,并且能够帮助这些团队开发出可以解决一些问题的新的功能。

TensorFlow是深度学习和机器学习最流行的开源框架之一。TensorFlow最初是由Google研究团队开发的并致力于解决深度神经网络的机器学习研究。另外,TensorFlow也适用于许多其他应用场景:图像识别,自由文本数据的自然语言处理以及威胁检测和监视等。

“TensorFlow是一个用于对一系列任务进行机器学习的开源软件库,它是一个构建和训练神经网络来检测、解读模式和相关性的系统,它与人类学习和推理相似(但不一样)。”——维基百科

TensorFlow可以在各种异构系统(包括CPU和GPU)上对计算资源进行合理分配。与我合作过的几个数据科学团队使用GPU来提高TensorFlow的计算速度,但GPU价格昂贵,他们需要对TensorFlow所占用的资源进行认真的管理

部署TensorFlow的注意事项

以下是部署数据科学应用程序和TensorFlow时的一些注意事项(尤其是在企业大规模部署时更应该注意):

1.如何对部署的复杂性进行管理,例如在OS,内核库和TensorFlow不同版本之间进行部署。

2.如何在作业期间支持创建临时集群。

3.如何隔离正在使用的资源并阻止同时队同一资源的访问请求。

4.如何在共享的多租户环境中对GPU和CPU资源进行管理和分配。

BlueData EPIC软件平台就可以解决这些问题,它能够按照数据科学团队的需要访问各种不同的大数据分析、数据科学、机器学习和深度学习工具。在一个灵活、弹性和安全的多租户架构中使用Docker容器,BDaaS(Big-Data-as-a-Service)软件平台可以支持大规模分布式数据科学和深度学习用例。

BlueData的最新版本可以支持启动采用GPU加速的集群,并且支持TensorFlow在GPU或Intel架构的CPU上进行深度学习。数据科学家可以在BlueData EPIC软件平台上启动即时TensorFlow集群在Docker容器上进行深度学习。BlueData支持在Intel Xeon硬件和Intel MKL上运行基于CPU的TensorFlow,也支持采用NVIDIA CUDA库、CUDA扩展以及用于Docker容器的字符设备映射的基于GPU的TensorFlow。

BlueData EPIC软件平台可以为TensorFlow提供自助服务、弹性和安全环境,无论是在本地、公共云还是在二者的混合结构中都拥有同样的界面,不管其底层架构多么不同,用户都会有相同的用户体验。

如下图所示,用户可以像用于其他大数据分析、数据科学和机器学习环境一样,能够很容易地将带有BigDL的即时TensorFlow集群在BlueData软件平台上进行深度学习。并且,用户可以指定在TensorFlow运行的Docker容器放置在有GPU还是CPU配置的基础架构,以及在公共云还是在本地。

 

按需创建TensorFlow集群

在BlueData EPIC软件平台上,用户只需点击几下鼠标即可根据自己的需求创建TensorFlow群集。BlueData的最新版本引入主机标签,用户可以创建具有主机标记的基于GPU或CPU的TensorFlow集群,这些主机标记为特定工作负载指定所需要的硬件,如下图所示。


一旦创建完成,TensorFlow集群将拥有一个或多个Docker容器节点,这些Docker容器使用TensorFlow软件和相应的GPU和/或CPU加速库进行部署。例如,基于GPU的TensorFlow群集将在Docker容器内具有NVIDIA CUDA和CUDA扩展;而基于CPU的TensorFlow群集则在Docker容器中具有Intel MKL和Jupyter Notebook扩展。

高效的GPU资源管理

GPU和特定的CPU通常不会作为Docker容器的独立资源。BlueData EPIC软件平台通过在所有主机上管理GPU的共享池并在群集创建期间将GPU所请求的数量分配给群集来处理此问题。这种排他性(或隔离性)保证了对深度学习作业的服务质量,并防止多个处理作业尝试同时访问同一资源。

对于今天的大多数企业来说,GPU是一种需要有效利用的高端资源。当一个集群没有在使用或完成一项作业时,BlueData EPIC软件平台可以停止该集群使用并将GPU分配给其他正在使用的集群。 这允许用户在不同的租户环境中创建多个集群,并且仅仅在集群需要时才使用GPU,而不需要删除或重新创建群集群。还有一种机制,即在作业期间创建一个群集作为暂时性集群。

提高用户生产力

一旦TensorFlow集群创建完成,用户可以使用AD / LDAP控制的SSH启用容器并保护Jupyter Notebook。

为了进行验证和测试,TensorFlow集群默认包含Jupyter Notebook,用例如下图所示。


上图来自于GitHub回购。这些源码和教程可供用户使用,并可以立即投入应用中去。

在BlueData EPIC软件平台上使用TensorFlow库和图表绘制的MNIST数据集的输入数字图像的重建示例如下图所示。


根据输入图像和模型(使用TensorFlow GradientDescentOptimizer训练)提取数据集和模型预测如下图所示:


对输入图像和输出预测结果的对比如下图所示:


对运行的TensorFlow集群更新

随着新的库和软件包不断被推出,数据科学团队的需求也在不断的变化,因此BlueData EPIC软件平台提供了一种称为“操作脚本”的机制,该机制允许用户使用新的库和软件包对正在运行集群的所有节点进行更新。在长时间运行的交互或批处理作业中,用户还可以使用基于Web的UI或RESTful API将Python作业提交。

作者:【方向】

点此查看原文: http://click.aliyun.com/m/43284/

识别以下二维码,干货:



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/522563.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一键部署 Spring Boot 到远程 Docker 容器

首先构建一个简单的 Spring Boot 项目,然后给项目添加 Docker 支持,最后对项目进行部署。 文章目录一、前提条件1. SpringBoot项目2. Docker插件3. Dockerfile文件4. 服务器Docker环境5. Maven环境二、技术选型三、新建SpringBoot项目1. pom2. DockerCon…

Docker,一个傲娇的男人

戳蓝字“CSDN云计算”关注我们哦!引言大概几个月前,我曾经写过一篇文章叫《微服务为什么一定要用docker》。当时,写完这篇以后,有些粉丝表示想看看基本入门教程,希望我写一篇。然后呢,大家也知道&#xff0…

英特尔核芯显卡控制面板没有了_只认性能你就输了!英特尔第十代酷睿处理器最全解析...

前不久,英特尔公布了第十代酷睿处理器“Ice Lake”的命名规则,AnandTech网站也曝光了“次旗舰”级别酷睿i7-1065G7处理器的实测性能(详见《10nm新架构Iris Plus核显 第十代酷睿到底有多强?》)。从结果来看,i7-1065G7的CPU性能提升…

阿里敏捷教练何勉:论精益思想及精益产品开发实践体系

摘要: 精益求精是工匠精神实现的最佳方法,通过引入实践精益思想的原则和方法进行精益产品开发,打造对客户最好的产品进行交付,其次通过精益思想的理念降低企业的运营成本,提高企业的运营效率。阿里资深解决方案架构师、…

html页面内分栏显示不全,怎么消除Word文档分栏后栏间不平衡现象

IE10浏览器打开网页鼠标不能滚动查看是怎么回事?IE10浏览器黑屏,但是滚动鼠标就好了,不到一分钟...在控制面板的电源设置中,将显示器的关闭时间调到你希望的时刻就可以了。word文档分栏后左右对不齐怎么办word文档分栏后左右对不齐…

开发经验分享_06_前端开发技巧

接上一篇:(企业内部)开发经验分享_05_葫芦画瓢 https://gblfy.blog.csdn.net/article/details/103414567 文章目录一、JS调试技巧1. 推荐使用consde.log2. 推荐理由3. Network正确的使用姿势①Headers一、JS调试技巧 1. 推荐使用consde.log 推荐使用consde.log(内…

Spring精华问答 | 为什么要学习Spring?

戳蓝字“CSDN云计算”关注我们哦!Spring是为解决企业应用程序开发复杂性而创建的一个Java开源框架,应用非常广泛。业内非常流行的SSH架构中的其中一个"S"指的就是Spring。今天我们就一起来看看关于Spring的精华问答!1Q:…

相关系数excel_如何用Excel计算投资组合的有效前沿?

假设一个投资组合由美债和美股构成,美债为跟踪美国投资级债券市场走势的交易所交易基金AGG,美股为跟踪美国标准普尔500指数走势的交易所交易基金SPY。注:在计算有效前沿曲线时投资回报率一般应采用预期回报率,但本文只是为了演示投…

CentOS 7 上安装vim 解決 centos -bash: vim: command not found

用CentOS上使用vim竟然用不了,报错没有该命令: centos -bash: vim: command not found 那么如何安裝 vim 呢? 输入 rpm -qa|grep vim 命令, 如果 vim 已经正确安裝,会返回下面的三行代码: rootserver1 [~]# rpm -qa|grep vim vim-enhanced-7.0.109-7.el5 vim-mini…

拼的html页面乱,页面分页html拼接

success:function(data){if(data.status "success"){var page data.p;var html;for(var i 0; ihtml html ;htmlhtml;htmlhtmlpage.result[i].infoTitle;htmlhtmlpage.result[i].infoDepict ;htmlhtml;}// 添加分页选项:下一页html html "" "&q…

LoRaWAN开放式实验平台

摘要: 本文介绍了基于loraserver和uDC的LoRaWAN开发平台,基于该平台用户无需投入硬件即可在设备端和服务端进行,极大的降低了入门和开发门槛。 点此查看原文:http://click.aliyun.com/m/43348/ 本文旨在介绍AliOS Things的LoRaWA…

华为开发者大会上,鸿蒙问世、方舟编译器开源、还有 EMUI 10;壕置100万美元,苹果推出漏洞攻击报告赏金计划……...

关注并标星星CSDN云计算极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周三次,打卡即read更快、更全了解泛云圈精彩newsgo go go 鸿蒙OS正式对外发布&#xf…

bootstarp怎么使盒子到最右边_折纸教程:漂亮花朵盒子图解,简单实用,一张纸就完成...

爱生活,爱手工,我是爱做手工的小曦!今天给大家带来的是颜值很高的花朵盒子折纸,可以放一些小物件哦!比如棉签什么的,还是很实用的。具体怎么折,和小曦一起来看看吧!花朵盒子折纸教程…

修改html自带组件样式,能否直接在组件html上为组件根元素设置自定义class

如题,假如我有一个spinner组件,它在不同的页面里,显示的位置是不同的,因此我需要为每个spinner设置不同的class。再假设我有一个middle样式,将一个元素显示在页面正中。现在我希望在当前这个页面里,spinner…

开放分布式追踪(OpenTracing)入门与 Jaeger 实现

摘要: 分布式系统的运维挑战 容器、Serverless 编程方式的诞生极大提升了软件交付与部署的效率。在架构的演化过程中,可以看到两个变化: 应用架构开始从单体系统逐步转变为微服务,其中的业务逻辑随之而来就会变成微服务之间的调用…

c语言网页版在线编译器_C语言编译器IDEapp下载-C语言编译器IDE官方版下载v1.5.1 安卓版...

c语言编译器IDE是专门为学习c语言的人专门打造的,解决了很多人身边没电脑的问题,这款软件是手机端的编译神器,用手机也可以学习c语言,软件中有很多详细的讲解原理,可以非常好的学习c语言,是初学者的好帮手&…

MWC18见闻录|阿里云的第一届“巴交会”

摘要: 上周,世界移动通信大会MWC18在巴塞罗那举行。非常荣幸能成为阿里云“巴交会”首秀小分队的一员。 短短四日,我们借此平台,给欧洲带去中国数字化转型的经验和技术。来自全世界的参会者也借此机会真实感受到了年轻且在高速发展…

这!不是一点儿super,青云混合云!

戳蓝字“CSDN云计算”关注我们哦!作者|刘晶晶“什么是混合云?”刚一开场,青云QingCloud解决方案及架构副总裁沈鸥就抛出了一个常听却做起来并不简单的问题。青云QingCloud解决方案及架构副总裁 沈鸥其实关于混合云,我们可以简单分…

查看系统版本

cat /etc/redhat-release