AI时代,企业如何利用机器学习技术驱动业务发展?

来源:全球人工智能

概要:在过去的这些年,为了构建基础设施,数据社区专注于聚集和收集数据,并使用数据来改进决策。


为了成为一个机器学习公司,你需要工具和流程去克服数据、工程和模型方面的挑战。


在过去的这些年,为了构建基础设施,数据社区专注于聚集和收集数据,并使用数据来改进决策。我们现在可以看到,对先进的分析和机器学习的兴趣在许多行业的垂直方领域上激增。


在这篇文章中,我分享了我去年9月在纽约Strata Data 公司发布的一篇演讲中的幻灯片和笔记,为大家提供一些对增强公司机器学习能力的建议。这些信息来自于在许多不同的问题领域中,应用机器学习的前沿的实践者、研究人员和企业家的对话。

与其他技术或方法一样,一个成功的机器学习项目从确定正确的用例开始。例如,机器学习推荐和减少客户流失的应用有很多,但对于应用程序来说,一个有用的分类有如下几点:


1.提高决策的应用程序

2.改进商业运营的应用程序

3.产生收入的应用程序

4.可以帮助预测或防止欺诈或风险的应用程序

为了成为一个“机器学习公司”,当你开始构建模型时,首先你要熟悉你将要面对的关键障碍是什么。如果你咨询主要的从业者,通常会有三件事:


1.数据:现在大多数应用都依赖于监督学习,所以一切都从质量良好的标记(训练)数据集开始。


2.工程:你如何使用一个原型并生产它?在部署到生产环境之后,如何监视模型?


3.模型:虽然现代的机器学习库使你更容易将模型与你的数据匹配,但仍然存在一些挑战


在这篇文章的剩余部分,我将讲解如何面对这些挑战。

在构建用于训练机器学习模型的标记数据集时,使用已访问的数据非常重要。随着新的数据源不断地出现在网络上,对大多数公司来说,数据集成是一项正在进行的工作——你目前对数据基础设施的投资甚至可以让你获得足够的数据来启动。你还可以使用公开的(开放的)数据或你可以从第三方提供商购买的数据来丰富现有的数据集。

好消息是机器学习社区意识到训练数据是一个主要的瓶颈。所以研究人员一直致力于那些让你从较少的训练数据(弱监督)开始或者允许你将一个问题中得到的知识用于另一个环境(转移学习)的研究。

随着数据越来越重要,有一些初创公司和公司在探索数据交换。数据交换使组织可以在保护隐私和机密的同时共享一些数据。同时,也有一些类似的研究,致力于开发安全的机器学习算法。在消费者金融领域存在应用欺诈检测,例如,如果隐私和安全能够得到保证,那么在机密数据上共享学习可能是有价值的。

今年早些时候,我们观察到,公司开始在构建机器学习模型和监控他们的行为方面创造了一个新的角色。但是机器学习工程师的新角色真的是必要的吗?

对于越来越多的公司来说,答案是:是的,这样的专家很需要。如果你创建了一个你需要知道的关于生产和监控模型的清单,那么你将得到一组广泛的工具和技术。

机器学习的研究正在飞速发展。公平地说,大多数公司都无法跟上研究人员发布的所有新技术和新工具。想象以下的实验:在接下来的五年里,进展会停滞不前(非常不可能,自我幽默一下)。我认为,有足够的工具可以让公司在很长一段时间里保持忙碌。

深度学习,一种已经成功应用于计算机视觉和语言问题的技术。大多数公司仍处于将深度学习应用于熟悉的数据类型(文本、时间序列、结构化数据)或使用它来替换现有模型(包括它们当前推荐系统)的早期阶段。我希望在接下来的几年里能看到许多有趣的,涉及到深层神经网络(DNN)的案例研究,。

随着关于深度学习的所有激动人心的一面,我们有时会忘记有很多有趣的,不依赖于神经网络的新数据应用。


随着模型被推向先进设备,我对最近在协作学习方面的工作感到兴奋。展望人工智能,在线学习和持续学习的工具将是必不可少的。

数据社区开始认识到,除了优化定量或业务指标之外,还需要更多的模型。模型是否强大到能抵御对抗性攻击?在某些应用程序模型中必须是可解释和可理解的。


公平:你了解你的训练数据的分布情况吗?如果你不了解,请注意过去的忽视可能会导致未来的忽视。


透明度:随着机器学习变得越来越流行,用户对那些被最优化的计量机构的了解和发言权越来越感兴趣。

尽管近年来这一领域取得了很大进展,但研究人员和理论家们仍不清楚这一点。我们仍然处在一个“试错”的时代。深度学习可能减少了对人工特征工程的需求,但是仍然有很多决策倾向于建立一个DNN(包括网络架构和许多超参数的选择)。


我们可以把模型构建看作是探索机器学习算法的空间。企业需要能够以一种有原则和高效的方式进行探索。这意味着维护可重复的管道,从实验中节省元数据,协作工具,并利用最近的研究成果。

那么,公司在做什么来让这种探索成为可能呢?大多数机器学习都需要标记(训练)数据,因此任何平台都从输入数据存储系统的强大数据管道开始,数据科学家和机器学习工程师可以访问这个数据存储系统。对于所有公司来说,数据集成是一项重要的、持续的练习。


公司还允许数据科学家共享特征和生成这些特征的数据管道。让你了解特性的相对重要性:让公司告诉你他们使用的是什么算法通常会容易得多;而要让他们描述什么对他们的模型是最重要的,则困难得多。


领先的公司让他们的数据科学家使用几个机器学习库。强迫你的数据科学家使用一两个“开发中的”库是很疯狂的。他们需要能够进行实验,这可能意味着让他们使用各种各样的库。


有些公司为生产机器学习模型提供工具,并在部署后监控它们。公司还在使用开源技术构建自己的部署和监控工具。如果你正在寻找一个用于模型部署和监控的开源工具,Clipper是加州大学伯克利分校的崛起实验室的一个新项目,它现在可以让你轻松地部署使用几个流行的机器学习库编写的模型。更重要的是,Clipper团队很快就添加了模型监控。(几家公司将在2018年3月的Strata Data San Jose,描述他们如何实现模型部署和监控)。


要成为一个“机器学习公司”,你需要工具和流程来克服数据、工程和模型方面的挑战。公司刚刚开始在他们的产品中使用和部署机器学习。工具仍在不断完善,最佳实践才刚刚开始出现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498258.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动移动文字html,css怎么移动文字?

css怎么移动文字?下面本篇文章给大家介绍一下方法。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。css怎么移动文字?首先可以用个容器来包住文字,给宽和高。然后,可以使用多种方法来移动…

医学知识图谱构建技术与研究进展

来源: 人机与认知实验室 概要:医学知识图谱是实现智慧医疗的基石,有望带来更高效精准的医疗服务。 摘要:医学知识图谱是实现智慧医疗的基石,有望带来更高效精准的医疗服务。然而,现有知识图 谱构建技术在医…

android animatorset 监听,Android源码分析--动画框架AnimatorSet

这一节,我要介绍的是AnimatorSet。一提到android的动画,一定会涉及到AnimatorSet,因为他太好用了。它所封装的接口让很多复杂的动画叠加变得容易。AnimatorSet是继承于Animator这个是非常重要的,因为AnimatorSet可以不停的叠加自身…

2017年全球最具影响力50家机器人公司排行榜!我国企业基本都有研发类似产品!

来源:机器视觉 概要:ABB Robotics是一家成立于1988年的瑞士工业机器人公司,主要涉及(新)能源和矿业、基础设施、生产/农业、供应链四个领域,关键技术包括数字化连接、工业设备和系统安装。 以下就是 2017 年…

android go 最小内存,谷歌更新Android Go新规则,由原本的支持低于1G内存设备上升到2G...

原标题:谷歌更新Android Go新规则,由原本的支持低于1G内存设备上升到2G说起安卓系统想必很多人都知道,但是你知不知道还有一个叫做安卓Go的系统呢?这个安卓Go的系统最初是谷歌在I/O 2017全球开发者大会上所发布的,它的…

神经学家探寻:机器如何拥有意识!如何避免机器人伤害我们!

来源:全球人工智能 概要:好莱坞导演们并非是对此问题困惑不解的唯一群体。随着机器智能的飞速发展,它不仅能在魔兽争霸(DOTA)和围棋这样的游戏中战胜人类玩家,而且对战过程中还不需要人类的专业知识&#x…

斯坦福大学「黑盒学习」研究:使用神经变分推理的无向图模型,可替代「采样」 | 附NIPS 2017论文

来源:雷克世界 编译:嗯~阿童木呀、多啦A亮 概要:机器学习中的许多问题可以自然地用无向图模型的语言表达。在这里,我们提出了无向模型的黑箱学习和推理算法,优化了模型的对数似然的变分近似。我们的方法的核心是我们表…

在html中怎么设置页面边距,在打印网页时怎么设置调整页边距

在打印网页时怎么设置调整页边距今天给大家介绍一下在打印网页时怎么设置调整页边距的具体操作步骤。1. 首先打开电脑,找到想要打印的网页打开。2. 点打开之后,在页面右上角点击三横图标。3. 在弹出的选项中点击“打印”选项。4. 进入打印页面后&#xf…

果蝇大脑研究能够改进计算机相似性搜索算法

来源:cnBeta.COM 概要:一项新的研究表明对果蝇大脑的研究可能作为计算机科学算法改进的关键基础,增强搜索引擎/人工智能在“相似性搜索”算法方面的准确性。 一项新的研究表明对果蝇大脑的研究可能作为计算机科学算法改进的关键基础&#xff…

ie11不识别html5影片,IE11无法显示flash?IE11无法播放视频的解决方法

ie11无法显示flash怎么办呢?ie11无法播放视频了,ie10也出现同样的问题,这该怎么办呢?下面小编就给你带来ie11无法显示flash解决方法。方法一:关闭IE10/IE11的Active刷选功能由于Adobe Flash Player IE版采用ActiveX控件加载方式运作&#x…

物联网时代传感器厂商竞争格局揭秘

来源:WPR 概要:中国作为全球最大的传感器消费市场,物联网产业圈的构建势在必行, 据预测,“十三五”期间,我国传感器市场年均复合增长率将达到30%以上。 中国作为全球最大的传感器消费市场,物联网…

html改元素怎么保存,是否可以在NW.js中保存html元素更改?

我正在开发一个简单的应用程序,允许用户上传图像和视频,同时这样做会自动为上传并包装的每个内容生成。每个上传的图片都保留在前一个特别风格化的图片旁边。我想要的是每次上传后(图片或视频),即使我关闭我的应用程序,它仍然存在…

机器对工作、生产力及全球经济的影响

来源:亿欧 概要:计算机科学家,经济学家和行业专家谈到了包括法律政策,技术挑战和辅助技术在内的一系列话题。 本周,麻省理工学院举办了“人工智能与工作的未来”峰会,重点讨论帮助行业,政府和员…

Html如何触发闹铃,事件闹钟设置.html

事件闹钟设置$axure.utils.getTransparentGifPath function() { return resources/images/transparent.gif; };$axure.utils.getOtherPath function() { return resources/Other.html; };$axure.utils.getReloadPath function() { return resources/reload.html…

CapsNet日益火爆!Hinton大神横扫AI界的「胶囊网络」如何理解?

来源:雷克世界 编译:嗯~阿童木呀 概要:Geoff Hinton等人最近关于胶囊网络(Capsule networks)的论文在机器学习领域造成相当震撼的影响。 Geoff Hinton等人最近关于胶囊网络(Capsule networks)的…

html code box插件,VS Code常用插件

基础必备插件1、View In Browser在浏览器里预览网页必备。2、vscode-icons改变编辑器里面的文件图标,个人比较稀饭这个。其他的这里就不说了。在这里插入图片描述3、Bracket Pair Colorizer给嵌套的各种括号加上不同的颜色。在这里插入图片描述4、Highlight Matchin…

新研究旨在用“黑箱”算法解决人工智能偏差问题

来源:亿欧 概要:随着越来越多的自动化决策,能够理解AI如何思考对我们来说变得越来越重要。 随着越来越多的自动化决策,能够理解AI如何思考对我们来说变得越来越重要。从挑选股票到检查X射线,人工智能越来越多地被用来…

清华大学:刘洋——基于深度学习的机器翻译

来源:图灵人工智能 概要:机器翻译的目标是利用计算机实现自然语言之间的自动翻译。机器翻译经历了规则机器翻译、统计机器翻译、神经机器翻译。 刘洋,清华大学计算机科学与技术系副教授,博士生导师,国家优秀青年基金获…

CMU本科计算机科学,CMU计算机科学学院本科难录吗?

卡内基梅陇大学计算机科学学院难录吗?CMU各个学院最难录的一个!1、2020第一学年新生计算机科学学院本科录取率:APPLICATIONS:6,681ADMITTED:479ENROLLED:219录取率:7%2、2020年卡内基梅陇大学计算机科学学院本科录取分数要求&…

从神经科学到计算机视觉:人类与计算机视觉五十年回顾

来源:全球人工智能 概要:在过去某段时间里,研究者们可能从来没有想过创建类似人类大脑处理任务一样的系统。 如何像人类大脑一样完成一项视觉任务是复杂的,比如深度感知、目标跟踪、边缘检测等,而扫描环境和定位是大脑…