企业如何采用机器学习

摘要: 向机器学习专家学习如何理解机器学习开发生命周期,以及如何建立一个团队通过机器学习来解决他们的业务问题。

毫无疑问,任何企业都可以利用机器学习的优势将机器学习应用到他们的业务过程中。而机器学习的意义将取决于它是如何被应用的,以及你要用它来解决什么样的问题。最终的结果还取决于你的数据科学家和软件工程师的经验,以及技术的应用。

在这篇文章中,我们将了解机器学习开发生命周期的真正面貌,看看企业如何建立一个团队并利用机器学习来解决他们的业务问题。让我们从下面的图片开始:


正如你在上面看到的,机器学习过程是一个连续的过程,从各种来源提取数据,然后输入到生成模型的机器学习引擎中。这些模型被插入到业务流程中以产生结果,而模型的结果被输入到解决业务问题的过程中。这些模型可以独立地在边缘产生结果,这取决于它们的用法。

在这一点上,最关键的问题是要了解机器学习的开发生命周期。需要什么样的技术才可以成功?团队在构建和应用机器学习时需要做什么?

随着我们的进一步深入,我们将得到上述问题的答案。看看下面的机器学习开发生命周期图,得到以下范例:

    1.从各种资源收集数据。

    2.收集数据后,使机器学习就绪。

    3.机器学习就绪,数据进入“构建机器学习”过程,数据科学团队从中获取结果。



从下图中可以看出,“构建机器学习”过程的最终结果是企业最终产品的模型。该模型可以根据需要生成结果。


这个模型可应用于各种消费者、企业和工业用例,以提供边缘级智能或过程智能,其中模型结果被输入到另一个过程中。有时,该模型被输入到另一个机器学习过程中,以产生进一步的结果。

另外,我们需要了解关键人员在端到端机器学习过程中的重要性,因此下一个问题是,关键人员在日常过程中做了什么?他们如何真正参与建立机器学习的过程?他们采用或创建什么样的工具和技术来解决企业的业务问题?

要理解数据科学家在构建机器学习时所做的工作,我们应该知道他们主要是在需要时应用机器学习引擎,并使用各种算法来解决特定的问题。有时候,他们创造了一些全新的解决方案,因为没有可用的方案,有时候,他们只需要改进可用的解决方案。


上面的图片将各种引擎的概念思想汇总在一起,可供数据科学家团队用来完成他们的任务。

软件工程师对整个机器学习至关重要。他们在应用数据科学家的软件工程方法的同时帮助加快和改进数据科学的过程,以更快地产生结果。

下图解释了软件工程师如何通过创建完全自动化的机器学习系统来加速数据科学家的工作,该系统以全自动方式执行数据科学家的重复任务。在这一点上,数据科学家可以利用这些来解决新问题,只需要关注自动化系统以确保其工作正常。


谷歌(CloudML)和H2OAutoML)等各种组织已经创建了可供任何企业使用的自动化机器学习软件。也有开源软件包,即Auto-SKLearn    TPOT 

任何企业都可以遵循上述细节,将机器学习应用到他们的工作中。

可参考的文章:

  • 自动机器学习的现状

  • H2OPythonScala中进行自动化机器学习


 以上为译文。

文章原标题《machine-learning-adoption-for-any-organization

译者:黄小凡,审校:袁虎。


原文链接


干货好文,请关注扫描以下二维码:





本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/522359.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spark精华问答 | spark的组件构成有哪些?

戳蓝字“CSDN云计算”关注我们哦!Spark是一个针对超大数据集合的低延迟的集群分布式计算系统,比MapReducer快40倍左右,是hadoop的升级版本,Hadoop作为第一代产品使用HDFS,第二代加入了Cache来保存中间计算结果&#xf…

binlog日志_mysql 重要日志文件总结

日志是所有应用的重要数据,MySQL 也有错误日志、查询日志、慢查询日志、事务日志等。本文简单总结下各种日志,以备查阅。二进制日志 binlog二进制日志 binlog 用于记录数据库执行的写入性操作(不包括查询)信息,以二进制的形式保存在磁盘中。使…

Python数据预处理:使用Dask和Numba并行化加速

摘要: 本文是针对Python设计一种并行处理数据的解决方案——使用Dask和Numba并行化加速运算速度。案例对比分析了几种不同方法的运算速度,非常直观,可供参考。如果你善于使用Pandas变换数据、创建特征以及清洗数据等,那么你就能够…

工作流实战_12_flowable 流程实例 终止流程

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示2. 代码分享1. 演示 2. 代码分享 public ReturnVo&l…

让运维更高效:关于ECS系统事件

摘要: 阿里云会针对ECS实例发布系统事件,当您收到阿里云计划维护的通知时,可以利用ECS系统计划事件了解与实例相关的计划维护操作,并根据您的业务特性选择合适的时间安排运维操作进行故障转移,减少对系统可靠性和业务连…

工作流实战_13_flowable 待办任务列表查询

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示2. 代码分享1. 演示 2. 代码分享 这里我使用的sql查…

openlayer xyz加载_webGIS实践:3_1_openlayer展绘点线面注记

上一篇已经讲了&#xff0c;怎么加载瓦片地图。这篇就看看怎么简单的渲染矢量点线面数据。最简单的&#xff0c;绘制点线面注记。效果长这样&#xff1a;新建一个文件FeatureOL.HTML。代码如下&#xff1a;<!DOCTYPE html> <html lang"en"> <head>…

反转了!“只问了1个框架,就给了35K的Python岗”

Python还有“敌人”吗&#xff1f;最近网络上一则帖子吸引了笔者&#xff0c;大意内容为&#xff1a;据说A是有2年多经验的Python工程师&#xff0c;面一个公司相关的岗位&#xff0c;由于人手紧缺&#xff0c;所以只问了一个框架&#xff0c;就按笔者提的35K办理了入职。&…

用深度学习解决Bongard问题

摘要&#xff1a; 本文介绍了深度学习和Bongard问题&#xff0c;以及如何用深度学习更好的解决Bongard问题。Bongard问题是苏联计算机科学家Mikhail Bongard提出的。从20世纪60年代&#xff0c;他致力于研究模式识别&#xff0c;并且设计了100个这样的谜题&#xff0c;使之成为…

数组下标越界可能出现的问题

可以看一下这个代码会出现什么问题&#xff1a;答案是在VS2013-VS2019中下面代码出现了程序死循环 APP 中接收数据代码&#xff1a;#include<stdio.h> int main(){ int i0; int arr[10]{0}; for(i0;i<12;i){printf("hehe\n"); } return 0&#xff1b; }# 原…

使用Jenkins+Sonarqueb进行自动化测试和代码质量检测

摘要&#xff1a; Jenkins Jenkins是一款开源的持续集成工具&#xff0c;它的特点&#xff1a;易于安装、易于配置、可扩展&#xff08;自己开发插件&#xff09;&#xff0c;并且它拥有数以百计的成熟插件&#xff0c;这种插件式的特点提供可做任何事情的可能。 简介 Jenkins …

工作流实战_15_flowable 我发起的流程实例查询

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示![在这里插入图片描述](https://img-blog.csdnimg.cn…

Istio 庖丁解牛六:多集群网格应用场景

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 钟华来源 | ServiceMesher随着容器技术的流行&#xff0c;大量互联网公司和传统 IT 企业都在尝试应用容器化和服务上云。容器化是一个持续的过程&#xff0c;伴随着多地域部署、安全等级隔离、多云和混合云等复杂的场景需求。…

编写python程序的步骤_编写python程序和运行.py文件的方法步骤

前提&#xff1a;已安装好 Subliume Test 3 且已经添加好python编译系统&#xff0c;已安装好python3.7 一.新建一个文本文档&#xff0c;将后缀名改为.py 二.使用 Subliume Test 3 打开该文件 三.编辑该文档内的代码 四.CTRL S >保存文本 五.将编译系统选择为python(首次开…

NAT网关之SNAT进阶使用(一)SNAT POOL

摘要&#xff1a; NAT网关是云上VPC ECS访问Internet的出入口。SNAT可实现指定的VPC ECS使用指定的公网IP访问互联网。阿里云NAT网关控制台创建SNAT条目时&#xff0c;默认是为指定的交换机配置1个公网IP地址。 &#xff08;一&#xff09;前言 为什么使用SNAT POOL NAT网关是云…

工作流实战_16_flowable 办理任务

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示2. 代码分享1. 演示 2. 代码分享 public ReturnVo&l…

OpenStack精华问答 | OpenStack的网络类型有哪些?

戳蓝字“CSDN云计算”关注我们哦&#xff01;关于OpenStack的探讨几乎从未间断&#xff0c;从2010年10月份一个版本正式发布至今&#xff0c;OpenStack在8年发展历程中&#xff0c;成为了最有争议的那一个。今天&#xff0c;我们就来看看有关于OpenStack的精华问答吧1Q&#xf…

秘籍分享:SLB实例克隆

摘要&#xff1a; 秘籍分享&#xff1a;SLB实例的备份与克隆 1. Greetings :) Hi&#xff0c;大家好&#xff0c;2018年春节刚过不久&#xff0c;想必大家一定觉得假期短暂&#xff0c;没有玩爽吧&#xff0c;但我们IT民工的命就是这么苦逼&#xff0c;想想也只能撸起袖子使劲干…

python爬取视频自动播放_如何在IPython笔记本上自动播放声音?

在你笔记本的顶端from IPython.display import Audio sound_file ./sound/beep.wav sound_file 应该指向服务器上的文件&#xff0c;或者可以在互联网上访问。 然后&#xff0c;在长时间运行的单元结束时 Audio(urlsound_file, autoplayTrue) 此方法使用新版iPython / Jupyter…

工作流实战_08_flowable 流程实例的启动

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示1. 演示 ### 2. 代码 public ReturnVo<ProcessI…