深入了解机器学习

摘要: 了解机器学习发展史、机器学习是什么?机器学习有什么?看看本文就够了。

如今机器学习已经成为了这个时代的热门话题。机器学习已经存在了几十年,但直到最近我们才得以利用这项技术。

接下来,让我们一起回顾一下机器学习的发展历史:



它是怎么运行的呢?

机器学习(ML)的处理系统和算法主要通过在数据和通过找出数据里隐藏的模式进而做出预测的识别模式。这里值得一提的是,机器学习属于人工智能(AI)领域,而人工智能又与更广泛的数据挖掘和知识发现领域相交叉。


机器学习(ML)其他用法的例子:

机器学习还可以用于下列内容:

·医疗保健:识别高危客户;优化诊断准确性;改进健康计划成本。

·社会:预测广告活动效果;预测消费者情绪或其反馈。

·航空:预测火箭发动机爆炸;预测试点能力;预测航线。

还有其他一些行业也希望通过利用这种技术来获得商业价值。事实上,根据普华永道2017年全球数字智商调查,54%的机构正在大量投资人工智能和机器学习。

它是如何完成的呢?

机器学习任务分为三类。

1. 监督ML:

大多数情况下,机器学习依赖于被标记为真或假的数据。

示例:教计算机学会根据人类完成的交易标签来识别潜在的欺诈性或非欺诈性交易,以确保获得高质量的数据。了解到欺诈性交易与非欺诈性交易之间的差异后,ML会自动对新交易数据进行分类以获得潜在的欺诈性活动。

2.  未受监督的ML:

与监督学习依赖于标签有所不同,该种类型的算法需要对象的各个方面提供大量的数据。

示例:在欺诈发生的情况下,提供欺诈者的各种属性以及一些交易价值,根据交易的固有特征和描述特征,无监督ML可以将交易分为两个不同的组。

3.  强化学习的ML:

示例:学习玩流行的棋盘游戏奥赛罗,ML会收到关于玩家是赢还是输的信息。该程序没有将数据库中的所有的动作都标记为赢了或输了,但却能知道整个游戏的最终结果。然后,ML可以进行多种游戏,每次都重视那些导致获胜组合的动作。

一些流行的方法:

ML中采用了多种学习方法,下面将为大家介绍一些最为常见的方法。

决策树学习:

一个预测模型,通过映射关于项目的观察结果,得出结论;使用决策节点的层次结构,当逐步回答时,可以将交易分类为欺诈或非欺诈。


回归学习:

回归学习是最重要和广泛使用的机器学习和统计工具之一。它能够通过学习依赖变量和预测变量之间的关系做出数据预测。


朴素贝叶斯学习:

这是一个概率图形模型,表示一组随机变量及其条件独立性;例如,欺诈者与交易金额,年龄,行为等之间的概率关系。


神经网络学习:

神经网络学习由多个隐藏层组成,模仿人脑的行为。深度学习包括多个一个接一个的神经网络。


使用机器学习打击金融诈骗:

由于金融诈骗给企业带了很大的信誉损失和财务破坏,引起了全球很多方面的关注。每年都有数百万的家庭遭受金融诈骗,经济损失达数亿美元。

曾经,有一家金融界被称为佼佼者的机构同意支付165亿美元来解决金融诈骗案。考虑到所有这些情况,将数据挖掘工具和技术用于检测可能的欺诈活动或事件变得很重要。

在研究可帮助我们识别欺诈活动的数据挖掘技术之前,首先根据2016年普华永道经济犯罪调查来查看欺诈行为。



有关详细的普华永道的报告,请点击此处

排名前三的风险预测算法和案例:

三大风险预测算法和案例如下:

·分类方法:用于生成可能的值(即true,false,yes,no,o,1等)。这种机器学习技术可以根据各种预测变量来分类特定债务会变成“好”还是“坏”。

·神经网络:在包含神经元和具有输入、输出和隐藏层节点的大型数据集上显示更好的结果。这种方法通常用于使用各种人口学,年龄和其他变量作为输入来执行信用评级预测。

·随机决策森林:分类的集合学习方法。他们在培训和输出种类时(即分类模式)构建了许多决策树。这被广泛用于执行信用风险预测。

Beneish M-Score是另一个在财务报表欺诈领域受欢迎的新兴数学模型。该模型使用财务比率和八个变量来确定一个组织是否操纵了其收入。这些变量是根据公司财务报表中的数据构建的,一旦计算出来,就会创建一个M-Score来描述盈余被操纵的程度。请注意,作为概率模型,它不会识别100%准确度的操纵器。

结论:

机器学习的好处主要是:

·通过快速集成进行数据驱动的决策:机器学习利用各种数据,帮助企业根据最新的数据模式不断升级其策略。

·加速洞察力:机器学习能够加快识别相关数据的速度使得利益相关者能够及时行动。例如,机器学习可以不断优化客户的下一个最佳报价,因此客户在中午可能看到的内容可能与同一个客户在晚上看到的内容不同。

·风险规避:机器学习给企业提供了防止诈骗者陷入困境并减轻潜在货币和监管复杂化的能力。

本文由阿里云云栖社区组织翻译。

文章原标题《Deep Dive Into Machine Learning

作者:Sunil Kappal

译者:乌拉乌拉,审校:袁虎。

原文链接

干货好文,请关注扫描以下二维码:




本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/522364.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python程序设计的基本步骤_Python程序设计课程教与学(54、72、80学时教学大纲)...

原标题:Python程序设计课程教与学(54、72、80学时教学大纲)《算法与程序设计》课程教学大纲 Programming and Algorithm Fundamentals (Python-based) 一.基本信息 课程学分:4 ; 面向专业:计算机…

百分点10周年乔迁新址 数据智能服务更上一层楼

戳蓝字“CSDN云计算”关注我们哦!作者 | 刘丹2019年8月,是百分点值得纪念和庆祝的日子,随着百分点团队的迅速扩大与蓬勃发展,全国各地业务开展的有声有色,业绩快速增长,在企业成立十周年之际,更…

用Python及深度学习实现iPhone X的FaceID功能

摘要: 本文主要是展示FaceID解锁机器的基本工作机制,采用的方法是基于人脸映射和孪生卷积神经网络,Github上附详细代码。对于果粉们来说,对新出的iPhone X讨论最多的是其解锁方式,TouchID的继承者——FaceID。对于新一…

工作流实战_11_flowable 流程实例 跟踪流程

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示2. 代码分享1. 演示 2. 代码分享 public byte[] cre…

企业如何采用机器学习

摘要: 向机器学习专家学习如何理解机器学习开发生命周期,以及如何建立一个团队通过机器学习来解决他们的业务问题。毫无疑问,任何企业都可以利用机器学习的优势将机器学习应用到他们的业务过程中。而机器学习的意义将取决于它是如何被应用的&…

Spark精华问答 | spark的组件构成有哪些?

戳蓝字“CSDN云计算”关注我们哦!Spark是一个针对超大数据集合的低延迟的集群分布式计算系统,比MapReducer快40倍左右,是hadoop的升级版本,Hadoop作为第一代产品使用HDFS,第二代加入了Cache来保存中间计算结果&#xf…

binlog日志_mysql 重要日志文件总结

日志是所有应用的重要数据,MySQL 也有错误日志、查询日志、慢查询日志、事务日志等。本文简单总结下各种日志,以备查阅。二进制日志 binlog二进制日志 binlog 用于记录数据库执行的写入性操作(不包括查询)信息,以二进制的形式保存在磁盘中。使…

Python数据预处理:使用Dask和Numba并行化加速

摘要: 本文是针对Python设计一种并行处理数据的解决方案——使用Dask和Numba并行化加速运算速度。案例对比分析了几种不同方法的运算速度,非常直观,可供参考。如果你善于使用Pandas变换数据、创建特征以及清洗数据等,那么你就能够…

工作流实战_12_flowable 流程实例 终止流程

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示2. 代码分享1. 演示 2. 代码分享 public ReturnVo&l…

让运维更高效:关于ECS系统事件

摘要: 阿里云会针对ECS实例发布系统事件,当您收到阿里云计划维护的通知时,可以利用ECS系统计划事件了解与实例相关的计划维护操作,并根据您的业务特性选择合适的时间安排运维操作进行故障转移,减少对系统可靠性和业务连…

工作流实战_13_flowable 待办任务列表查询

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示2. 代码分享1. 演示 2. 代码分享 这里我使用的sql查…

openlayer xyz加载_webGIS实践:3_1_openlayer展绘点线面注记

上一篇已经讲了&#xff0c;怎么加载瓦片地图。这篇就看看怎么简单的渲染矢量点线面数据。最简单的&#xff0c;绘制点线面注记。效果长这样&#xff1a;新建一个文件FeatureOL.HTML。代码如下&#xff1a;<!DOCTYPE html> <html lang"en"> <head>…

反转了!“只问了1个框架,就给了35K的Python岗”

Python还有“敌人”吗&#xff1f;最近网络上一则帖子吸引了笔者&#xff0c;大意内容为&#xff1a;据说A是有2年多经验的Python工程师&#xff0c;面一个公司相关的岗位&#xff0c;由于人手紧缺&#xff0c;所以只问了一个框架&#xff0c;就按笔者提的35K办理了入职。&…

用深度学习解决Bongard问题

摘要&#xff1a; 本文介绍了深度学习和Bongard问题&#xff0c;以及如何用深度学习更好的解决Bongard问题。Bongard问题是苏联计算机科学家Mikhail Bongard提出的。从20世纪60年代&#xff0c;他致力于研究模式识别&#xff0c;并且设计了100个这样的谜题&#xff0c;使之成为…

使用Jenkins+Sonarqueb进行自动化测试和代码质量检测

摘要&#xff1a; Jenkins Jenkins是一款开源的持续集成工具&#xff0c;它的特点&#xff1a;易于安装、易于配置、可扩展&#xff08;自己开发插件&#xff09;&#xff0c;并且它拥有数以百计的成熟插件&#xff0c;这种插件式的特点提供可做任何事情的可能。 简介 Jenkins …

工作流实战_15_flowable 我发起的流程实例查询

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示![在这里插入图片描述](https://img-blog.csdnimg.cn…

Istio 庖丁解牛六:多集群网格应用场景

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 钟华来源 | ServiceMesher随着容器技术的流行&#xff0c;大量互联网公司和传统 IT 企业都在尝试应用容器化和服务上云。容器化是一个持续的过程&#xff0c;伴随着多地域部署、安全等级隔离、多云和混合云等复杂的场景需求。…

NAT网关之SNAT进阶使用(一)SNAT POOL

摘要&#xff1a; NAT网关是云上VPC ECS访问Internet的出入口。SNAT可实现指定的VPC ECS使用指定的公网IP访问互联网。阿里云NAT网关控制台创建SNAT条目时&#xff0c;默认是为指定的交换机配置1个公网IP地址。 &#xff08;一&#xff09;前言 为什么使用SNAT POOL NAT网关是云…

工作流实战_16_flowable 办理任务

项目地址https://gitee.com/lwj/flowable.git代码分支flowable-base视频讲解地址https://space.bilibili.com/485524575/channel/detail?cid94579 用户名密码0000001test0000002test0000003test0000004test文章目录1. 演示2. 代码分享1. 演示 2. 代码分享 public ReturnVo&l…

OpenStack精华问答 | OpenStack的网络类型有哪些?

戳蓝字“CSDN云计算”关注我们哦&#xff01;关于OpenStack的探讨几乎从未间断&#xff0c;从2010年10月份一个版本正式发布至今&#xff0c;OpenStack在8年发展历程中&#xff0c;成为了最有争议的那一个。今天&#xff0c;我们就来看看有关于OpenStack的精华问答吧1Q&#xf…